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Avant-propos 


Cet ouvrage est destiné à fournir au lecteur les bases de la génétique des 
populations. Notre but a été ici de présenter les concepts fondamentaux qui 
permettent de modéliser le devenir des populations et des espèces, et de 
comprendre la signification d'une partie des débats concernant les questions 
de biodiversité. Nous nous adressons d'abord aux étudiants en biologie, aux 
candidats aux concours et aux professeurs du secondaire qui ont vu arriver 
cette discipline dans les programmes séolaires, mais aussi aux gestionnaires 
du milieu naturel et à tous ceux qui veulent comprendre au moins le langage 
dans lequel on peut étudier la variabilité génétique. 


La génétique des populations a été élaborée dans les années trente par 
Fisher, Haldane et Wright sur des bases mathématiques appliquées à l’héré- 
dité mendélienne. Nous avons tenté d'être aussi simples que possible dans 
ces domaines. Cependant, le lecteur aura besoin, pour pouvoir suivre 
l’ensemble, de connaître des rudiments de probabilités (lois de probabilité, 
probabilités conditionnelles, loi binomiale) ainsi, bien sûr, que les bases de la 
génétique (à un ou deux locus). 

Ce précis de génétique des populations est issu du document que les 
auteurs ont rédigé alors qu'ils étaient enseignants à l'Institut national agro- 
nomique de Paris-Grignon sous la direction de Georges Valdeyron. lls 
tiennent à lui exprimer ici toute leur reconnaissance et leur respect. Ni Pun 
ni l’autre n'aurions pu nous consacrer à la génétique des populations sans 
lui : ce livre lui doit donc tout. La rédaction a bénéficié, en outre, de l’aide 
de ses successeurs, André Gallais et Philippe Brabant ainsi que de celle de 
Sophie Gerber et d'Irène Till-Bottraud. Qu'ils en soient remerciés. 


Jean-Pierre Henry et Pierre-Henri Gouyon 


Introduction 


Bien que les principes régissant la transmission du matériel héréditaire 
aient été découverts par Mendel dès 1865, l'importance de ses travaux ne 
fut pas réalisée à son époque. Ce n'est qu'à partir de 1900 que la redécou- 
verte de ces lois devait donner lieu au développement d’une nouvelle 
science, la génétique, avec le succès que l’on sait. 


À cette époque, beaucoup de généticiens pensèrent que leurs découver- 
tes rendaient caduque la théorie darwinienne de l'évolution par sélection 
naturelle : pour eux l’évolution s’expliquait par des mutations; une évolution 
graduelle de caractères quantitatifs sous l’action de la sélection naturelle, 
telle que l'avait proposée Darwin (1859), leur paraissait contraire à ce que 
l'on commençait à connaître de l'hérédité. Pour rapprocher les points de 
vue, il fallut d'abord éclaircir l’hérédité des caractères quantitatifs et com- 
prendre qu’elle pouvait s'expliquer par la ségrégation de nombreux gènes 
influençant le même caractère, avec généralement, en plus, une forte 
influence du milieu (ce sont les travaux de Johannsen sur l'hérédité de la 
taille des graines de haricot qui l’amenèrent à séparer clairement et à propo- 
ser en 1909 les termes « génotype » et « phénotype », ce dernier influencé à 
la fois par le génotype et par le milieu). D'autre part, il fallut réaliser que si 
les mutations étaient, bien sûr, un préalable nécessaire à l'apparition de 
nouveaux gènes, on devait comprendre aussi comment ces nouveaux gènes 
pouvaient remplacer les anciens, donc raisonner en termes de fréquence 
des gènes dans les populations. C'est là l’objet de la génétique des 
populations. 

La génétique des populations est donc née dans les années 1920 de 
la volonté de concilier la théorie darwinienne de l’évolution et les données 
de plus en plus précises acquises depuis le début du xx° siècle sur la trans- 
mission du matériel héréditaire. Cette harmonisation a d’abord été faite par 
des mathématiciens (R.A. Fisher) et des biologistes (J.B.S. Haldane, 
S. Wright), qui ont construit des modèles décrivant l’évolution des popula- 
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tions. Le but de la génétique des populations est, par des modèles de plus en 
plus élaborés, de rendre compte de l’évolution. 


Elle repose donc largement sur la construction de modèles mathémati- 
ques. Mais ces modèles doivent être confrontés à la réalité. La génétique des 
populations inclut aussi l'observation de populations naturelles (animales, 
végétales ou humaines), et des expériences de laboratoire, afin de suivre 
l’évolution de la fréquence des gènes et de mesurer les paramètres qui inter- 
viennent dans les modèles. Un frein a longtemps été la difficulté de trouver 
dans les populations des gènes « marqueurs » dont on puisse étudier la fré- 
quence, une large part de la variation phénotypique observable dans les 
populations avant un déterminisme génétique trop complexe ou trop 
influencé par le milieu pour être utilisable à cette fin. On était obligé de se 
limiter à quelques marqueurs tels que les groupes sanguins chez l’homme, 
des caractères de coloration chez des animaux... Les techniques d’électro- 
phorèse des protéines à partir de 1966, puis plus récemment les techniques 
d'étude au niveau de l'ADN lui-même, ont mis à la disposition des cher- 
cheurs un nombre considérable de nouveaux marqueurs. Les données ainsi 
acquises ont parfois conduit à remettre en cause certaines idées anciennes, 
et jouent un rôle important dans les développements en cours. 


A 


Principales notions 
de génétique des populations 


Structure génétique 
des populations 


Dans une population haploïde, la proportion des individus portant un 
allèle donné fournit directement la fréquence de cet allèle dans la popula- 
tion. Mais, dans les populations diploïdes, qui sont celles auxquelles nous 
nous intéresserons principalement, les gènes sont associés par paires dans 
les individus; il est alors nécessaire de distinguer deux paramètres pour 
décrire la composition génétique de la population au locus considéré : 


+ Les fréquences génotypiques sont les fréquences des différents ` 
génotypes au locus considéré. L'ensemble de ces fréquences donne la 
structure génotypique de la population pour ce locus. 

e Les fréquences alléliques (dites aussi fréquences géniques) sont les 
fréquences dans la population des différents allèles au locus considéré. Leur 
connaissance donne la structure allélique (ou génique) de la population. 


C'est l’ensemble de ces paramètres qui permet de décrire la structure 
génétique des populations. 

La connaissance de la structure allélique est importante pour le généti- 
cien des populations car c'est d’abord l'évolution des fréquences des gènes 
qui est significative pour l’évolution : la population est vue comme un 
« pool » de gènes dont la composition est susceptible d'évoluer, les individus 
n'étant que les porteurs transitoires de ces gènes. D'autre part, il est souvent 
plus simple dans les modèles de considérer les fréquences des gènes que 
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celles des génotypes qu'ils engendrent par leur association dans les zygotes. 
Toutefois, si la connaissance de la structure génotypique fournit facilement 
celle de la structure allélique (encadré 1), il faut être conscient que ce pas- 
sage fait perdre de l'information : le passage inverse est impossible sans 
information ni hypothèse supplémentaire; en effet, avec les mêmes fréquen- 
ces alléliques, on peut avoir des structures génotypiques très différentes 
selon que les gènes homologues sont associés dans les individus plutôt entre 
gènes semblables (on a surtout des homozygotes) ou plutôt entre gènes dif- 
férents (on a des hétérozygotes); ainsi une population avec 50 % de gènes 
A et 50 % de gènes a peut être constituée uniquement d'homozygotes AA 
et aa, ou uniquement d'hétérozygotes Aa, ou de diverses proportions de ces 
trois génotypes. 

Enfin, il peut être nécessaire, pour comprendre l’évolution d'un carac- 
tère, de considérer plusieurs locus à la fois. Il faut donc connaître la structure 
génétique à chaque locus impliqué; mais cela ne suffit pas. Il faut être cons- 
cient, là aussi, que d’autres paramètres seront nécessaires pour décrire la 
façon dont les gènes de locus différents seront associés dans les individus. 
Ainsi, si nous savons qu’une population contient 50 % d'individus AA et 
50 % de aa à un premier locus, 50 % d'individus BB et 50 % de bb à un 
second locus, la structure génétique est parfaitement définie à chacun de ces 
locus. Mais cela ne nous dit pas si la population contient des individus AABB 
et aabb, ou AAbb et aaBB, ou les quatre et en quelles proportions. Les 
modèles qui étudient l'évolution de la structure génétique à plusieurs locus à 
la fois doivent donc manipuler davantage de paramètres et sont souvent 
d'une grande complexité. Dans la suite de cet ouvrage introductif, nous nous 
limiterons presque uniquement à des modèles à un seul locus {ce qui permet 
tout de même des généralisations intéressantes!) et nous nous contenterons 
de présenter comment on peut décrire l'évolution de la structure génétique 
à plusieurs locus simultanément par un choix de paramètres assez simple 
pour que les modèles restent mathématiquement traitables. 


Principales notions de génétique des populations 


ENCADRÉ 1 : STRUCTURE GÉNÉTIQUE DES POPULATIONS 


Structure génotypique en un locus 


Décrite par l'ensemble des fréquences dans la population des différents génotypes au 
locus considéré, sa connaissance directe n'est possible que si l'on peut reconnaître les 
différents génotypes à ce locus, par leur phénotype (variation discontinue, pas de domi- 
nance) ou par l'examen de leurs descendances. 


fr(AA) = — 


fr (AA) fréquence des individus ayant le génotype AA. 
naa nombre d'individus ayant ce génotype. 
N nombre total d'individus de la population. 


Structure allélique 


Elle est décrite par l'ensemble des fréquences des allèles au locus considéré. 
Cas d'un locus biallélique A, a : 3 génotypes : AA, Aa, aa. 
Fréquence de l'allèle À : 


Nombre de gènes A _ 2/44 + Paa = gaat Lfrçaa) 


Nombre total de gènes 2N 


Fréquence de l'allèle à : 


Nombre de gènes a _ 2133 + aa 


1 
Nombre total de gènes 2N feat 2 FAR) 


g=1-pz= 


Ces formules sont toujours vraies : elles n'impliquent aucune supposition sur le régime 
de reproduction ou l'existence (ou non) de pressions évolutives. 


Cas d'un locus multiallélique : Ap Ass Aires An 
Fréquences alléliques : Pye Ph esy- Pise Pa 
2na, + Daa 

= jé 
Pi= =N = faa +5 PA 


Remarque : en général on n‘échantillonne qu'une fraction de la population (entité 
elle-même généralement mal définie dans ses limites). Les fréquences calculées 
comme ci-dessus à partir d'un échantillon sont des estimateurs sans biais des fréquen- 
ces de la population. 


Étude théorique d'un cas idéal 


Le premier modèle publié concernant la structure génotypique d’une 
population l’a été simultanément et indépendamment par le mathématicien 
anglais G.H. Hardy et par le médecin allemand W. Weinberg en 1908. 

Dans leur modèle, ces auteurs ont adopté des hypothèses permettant de 
simplifier les calculs et le raisonnement. Ces hypothèses sont les suivantes : 

H; : les gamètes s'associent au hasard par rapport aux gènes considérés 
{hypothèse de la panmixie). 

H; : la population a une taille infinie; la fréquence d'un événement est 
donc égale à sa probabilité (loi des grands nombres). 

H, : la fréquence des gènes n'est pas modifiée d’une génération à la 
suivante par : 


e la mutation; 
s un tri sélectif s’exerçant sur ces gènes (sélection); 


e un manque d'isolement de la population entraînant l'apport de gènes 
issus d’autres populations (migration). 


Considérons une population diploïde dans laquelle coexistent deux allèles 
en un locus, À et a, en fréquences respectives p et q (p + q = 1). La popu- 
lation gamétique est donc composée de gamètes porteurs de l’allèle À en 
fréquence p, et de gamètes porteurs de a en fréquence q. En appliquant les 
hypothèses H; et Hz, la génération diploïde suivante s'obtient par le tableau 
ci-dessous où la fréquence de chaque case est le produit des fréquences de 
la ligne et de la colonne correspondantes : 
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Gamètes mâles A a 
Gamètes femelles p gq 
A AA Aa 
| p P pq 
a Aa aa 
q pq g 


La structure génotypique de la nouvelle génération produite est donc : 


p? individus AA 
2 pq individus Aa 
@ individus aa 


Cette structure génotypique est célèbre sous le nom de structure de 
Hardy-Weinberg. 

Selon l'hypothèse Hz, les gamètes que produira cette nouvelle généra- 
tion contiendront : 


, 


e le gène A en fréquence p’ = p” + 5.(2pa) = p(p+q) 


P 


7 


e le gène a en fréquence q 7 (2p9) + q? qa(p+q)=4 


Ainsi, étant donné les hypothèses faites, les fréquences des gènes et des 
génotypes ne varient pas d’une génération à l'autre. 

G.H. Hardy en concluait, dans son article de 1908 : « En un mot, nous 
n'avons pas la moindre raison de penser qu’un caractère dominant 
devrait montrer une tendance à envahir la population, ni qu’un récessif 
devrait tendre à disparaître. » 

La loi de Hardy-Weinberg est actuellement énoncée sous la forme 
suivante : 


| Dans une population isolée d'’effectif illimité, non soumise à 
la sélection, et dans laquelle il n’y a pas de mutation, les fré- 
quences alléliques restent constantes. 

Si les accouplements sont panmictiques, les fréquences 
génotypiques se déduisent directement des fréquences 
alléliques selon la relation ci-dessous; elles restent donc aussi 
constantes. 


AA Aa aa 
Ca 2pq q 
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S'il y a plus de deux allèles au locus considéré (A;, A2, .…., À, ...A,) en 
fréquences p, P2, --- Pp .…, Pa il existe n (n + 1)/2 génotypes différents et 
la structure de Hardy-Weinberg devient : 


e homozygotes A; A; en fréquence p? 
e hétérozygotes A; Ajen fréquence 2 p;p; 


Ily a en fait, dans la loi de Hardy-Weinberg, deux aspects tout à fait indé- 
pendants. 

La première partie de l'énoncé ci-dessus peut être vue comme un 
truisme : elle dit que s’il n'y a rien pour faire changer les fréquences alléliques 
(aucune des quatre pressions évolutives : mutation, migration, sélection et 
hasard lié à un effectif fini), elles ne changent pas. Cela peut être vu aussi 
comme un principe fondamental, analogue au principe d'inertie en physi- 
que. Il est important de réaliser que ce principe est vrai qu'il y ait ou non pan- 
mixie. Il est tout aussi vrai, par exemple, pour une population d'organismes 
haploïdes se multipliant végétativement : dans une population de bactéries 
avec deux formes différant par leur allèle en un locus (A; ou A2), s’il n'y a 
pas de mutation transformant un allèle dans l'autre, si le milieu ne favorise 
pas la multiplication ou la survie d’une des formes, et que la population ne 
reçoit pas d'éléments extérieurs, si, enfin, cette population peut être consi- 
dérée comme infinie, les proportions des deux formes ne changeront pas. 


La seconde partie de la loi de Hardy-Weinberg établit une relation entre 
fréquences génotypiques et fréquences alléliques lorsqu'il y a panmixie. Au 
stade zygotes, cette relation est vraie dès qu'il y a panmixie, même si des 
pressions évolutives interviennent pour modifier les fréquences alléliques au 
cours du cycle qui fait passer d’une génération à la suivante. Imaginons par 
exemple un organisme marin qui émet ses gamètes dans l'eau où ceux-ci 
s'unissent au hasard; les zygotes produits seront en fréquences p° AA, 2pq 
Aa et q° aa, p et q étant les fréquences des gamètes A et a qui se sont unis. 
Cela reste vrai si, parmi les individus qui ont produit ces gamètes, les indivi- 
dus AA en produisent davantage que les autres (ils ont une meilleure fertilité, 
c'est une forme de sélection), ou si lors de la production de ces gamètes des 
gènes À ont muté en a. Simplement, dans ce cas, les fréquences alléliques p 
et q dans les gamètes et les zygotes ne sont plus les mêmes que les fréquen- 
ces alléliques de la génération parentale. 


Ceci explique que la structure de Hardy-Weinberg décrive beaucoup de 
populations relativement bien, alors que les hypothèses de Hardy-Weinberg 
ne sont pratiquement jamais vérifiées. Il suffit qu'il y ait union au hasard vis- 
à-vis du locus considéré et que rien (par exemple une mortalité différentielle) 
n'ait modifié sensiblement les fréquences génotypiques entre le stade zygote 
et celui où est faite l'observation. La conformité d’une population à une 
structure de Hardy-Weinberg peut être testée à partir de sa composition 
génotypique (encadré 2). 
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Le modèle de Hardy-Weinberg constitue le modèle le plus simple possible. 
Nous allons reprendre une par une les hypothèses de ce modèle de référence, 
afin de voir ce qui se passe si elles ne sont plus vérifiées; nous allons donc étu- 
dier leur influence respective sur les structures et sur l'évolution de la population. 


Influence du régime 
de reproduction 


Le régime de reproduction décrit la manière dont les gamètes s’assem- 
blent vis-à-vis du (ou des) gène(s) considéré(s), pour former la génération 
suivante. Chez la plupart des animaux, il s'agit donc de décrire la façon dont 
se constituent les couples; chez les plantes à fleurs, il peut être plus pertinent 
de considérer les plantes mères et les grains de pollen qui les fécondent. 


3.1 LA PANMIXIE 


L'hypothèse H; supposait l'association au hasard des gamètes. Ce 
régime particulier est appelé panmixie. Il peut s'agir d'une union au hasard 
des gamètes eux-mêmes s'ils sont émis dans le milieu, ou bien, ce qui revient 
au même, d'une formation des couples au hasard relativement aux gènes 
que portent les conjoints au locus considéré : il ne doit pas y avoir de corré- 
lations entre leurs génotypes, c’est-à-dire que le fait de connaître le génotype 
d’un des conjoints ne fournit aucune information sur ce que pourrait être le 
génotype de l’autre. 

Ce régime confère à la population une structure génotypique compre- 
nant 2pq hétérozygotes. C'est à cette valeur de 2pq que nous allons nous 
référer pour classer les régimes de reproduction : nous appellerons régi- 
mes fermés ceux qui donnent un taux d’hétérozygotes inférieur à 2pq et 
régimes ouverts ceux qui en donnent plus que 2pq. 
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ENCADRÉ 2 : TEST DE LA CONFORMITÉ D'UNE POPULATION 
À LA STRUCTURE DE HARDY-WEINBERG 


Lorsqu'un échantillon issu d'une population est étudié à un locus donné, et que sa 
composition génotypique peut être établie, il est possible de tester si les fréquences 
génotypiques observées correspondent ou non à une population ayant la structure de 
Hardy-Weinberg. 


Si l'échantillon présente la composition suivante, pour un locus biallélique A, a: 


Génotypes AA Aa aa Total 
Effectifs observés N, N, N; N 


les allèles A et a sont par conséquent représentés en fréquences p et q telles que : 


2N +N; Na +203 
=— IN 1 = -5N 


Ces fréquences sont des estimateurs des fréquences réelles de la population dans 
laquelle l'échantillon a été tiré. En supposant que la population possède la structure de 
Hardy-Weinberg, les effectifs attendus dans l'échantillon devraient être : 


Génotypes AA Aa aa 
Effectifs attendus No 2Npq NF 


Une statistique X, qui mesure l'écart entre les effectifs réellement observés et ceux qui 
sont attendus si la structure de Hardy-Weinberg est respectée, peut être calculée : 


(effectif attendu — effectif observé)? 


XE ; effectif attendu 
génotypes 
2 2 2 2 2 
(ND°-N;) (2Npg-N,) (Ng°-N;) 
X= 7 —+ RÉ 
Np 2Npq Nq 


Si l'hypothèse est vraie (la population observée a une structure de Hardy-Weinberg), alors 
la statistique X suit une loi du x? à 1 degré de liberté?. Cela signifie que si un grand nom- 
bre d'échantillons de même taille étaient tirés dans la population et que la valeur de X 
était calculée pour chacun d'entre eux, l'ensemble de ces valeurs serait reparti selon une 
loi du x2. II s'agit alors de comparer la valeur de X obtenue pour l'échantillon étudié avec 
les valeurs de la loi. Si cette valeur correspond à une probabilité d'être observée inférieure 
à 5 ou 1 %, on peut rejeter l'hypothèse de conformité. Le risque de rejeter cette hypo- 
thèse alors qu'elle est vraie est alors de 5 % ou de 1 %. 


a. 


Si la population présente n ailèles au locus étudié, le nombre de degrés de liberté de la loi du x? 


utilisée sera égal au nombre de génotypes possibles moins n. 
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3.2 LES RÉGIMES FERMÉS 


Ce sont d'une part, la consanguinité, dont la forme la plus extrême est 
l'autogamie, et d'autre part, l'homogamie. 


3.2.1 Exemple de l’autogamie 


L'exemple le plus extrême de régime fermé est l'autogamie, où chaque 
individu se reproduit par autofécondation. 

Les homozygotes AA et aa ne donnent que des descendants identiques à 
eux-mêmes alors que les hétérozygotes Aa donnent une disjonction à cha- 
que génération suivant la formule mendélienne : 


AA Aa aa 
1 1 1 
4 5 4 


La proportion d'individus hétérozygotes est, de ce fait, divisée par deux 
à chaque génération et la population tend rapidement vers l'homozygotie 
totale avec seulement des individus de génotype AA et aa. À la génération 
g, la proportion d'hétérozygotes est donc : 


H 
tigel- _‘"o 
H, = 5 = 


Nous avons envisagé ici l’évolution de la structure génotypique. Qu'en 
est-il des fréquences alléliques dans la population? Pour un locus, avec trois 
génotypes AA, Aa et aa, si nous appelons D,, H, et R, les fréquences géno- 
typiques respectives à la génération g (D pour « dominant», H pour 
« hétérozygote » et R pour « récessif », bien que les relations de dominance 
n'aient aucune importance dans l'affaire), les fréquences alléliques sont : 


1 1 f1 


1 
A P = D+ 3H = (Dirt 3He-1)+3(3He-1) 
SD e EHE 
Sgi" a g-1 7 Pg-1 
a de = 1-Pa = l-Pa-1 = qg-1 


Les fréquences alléliques sont donc, ici aussi, constantes. Cela ne doit 
pas nous surprendre, puisque nous n'avons introduit dans notre modèle 
aucune des forces susceptibles de faire varier la fréquence des gènes. En 
l'absence de toute autre force, l’autogamie ne modifie pas les fréquences 
géniques mais change seulement les fréquences génotypiques en redistri- 
buant les allèles; il en résulte finalement à l'infini la structure génotypique : 


pAA + qaa 
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Cette disparition des hétérozygotes se produit à la fois pour tous les locus. 
Une autre façon d'exprimer les choses est donc de dire qu’en autogamie, la 
proportion des locus hétérozygotes dans le génome de chaque individu est 
divisée par deux à chaque génération. On tend donc vers des individus homo- 
zygotes à tous leurs locus, ce qu’on appelle des lignées pures. 


3.2.2 La consanguinité 


La consanguinité est un régime de reproduction où les unions se font 
entre individus apparentés, c’est-à-dire ayant un ou des ancêtres com- 
muns. Il s'ensuit que ces individus ont souvent les mêmes gènes hérités de 
leurs ancêtres communs. Un individu issu d’une union entre deux apparen- 
tés est dit consanguin. À un locus donné, il aura donc pu recevoir de ses 
deux parents des copies d'un même gène de l’ancêtre commun; un individu 
consanguin est, par conséquent, plus souvent homozygote (et moins 
hétérozygote) qu'un individu issu de l'union de deux individus non apparen- 
tés. Dans une population, une propension aux unions consanguines 
entraîne ainsi un déficit d’hétérozygotes par rapport à 2pq. Ce régime de 
reproduction, comme pour l’autogamie, concerne l’ensemble du génome.* 


L'autogamie est, en fait, la forme la plus extrême de la consanguinité. En 
effet, l'individu avec lequel un individu est le plus apparenté (a le plus de 
gènes en commun), c'est lui-même. Un régime consanguin systématique 
autre que l'autogamie conduit aussi, bien que plus lentement, à la disparition 
des hétérozygotes. Ainsi, on peut montrer que lorsque les croisements se 
font systématiquement entre frère et sœur (ou parent et enfant), un niveau 
donné d'homozygotie est obtenu après un nombre de générations trois fois 
plus élevé, environ, qu'avec l'autogamie, mais, là aussi, on aboutit finale- 
ment à une disparition des hétérozygotes. Les croisements entre cousins 
germains, ou entre oncle et nièce, mènent encore plus lentement l'ensemble 
du génome à l’homozygotie. 


Étude détaillée de la consanguinité 


À cause de l'importance particulière de la consanguinité en zootechnie, 
nous détaillons dans l’encadré 3 les méthodes de calcul des paramètres les 
plus utiles dans les modèles. 

Lorsque deux gènes homologues sont deux copies {sans mutation) d’un 
même gène ancêtre, ils sont dits identiques. Noter que ce terme a, en 
génétique des populations, un sens très précis et restrictif : un homozygote 
quelconque AA n’a pas, en général, deux gènes identiques; ce ne peut être 
le cas que s’il est consanguin. 


* Ceci ne s'applique pas aux gènes déterminant un régime d'hétérogamie; voir plus loin. 
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ENCADRÉ 3 : DÉFINITIONS ET CALCUL DES COEFFICIENTS 
DE CONSANGUINITÉ ET DE PARENTÉ 


Définitions 


Consanguinité : régime de reproduction où les unions se font entre individus 
apparentés. ` 
Deux individus sont dits apparentés si et seulement si ils ont au moins un ancêtre 
commun. 

Un individu est dit consanguin si et seulement si ses deux parents sont apparentés. 
Deux gènes sont dits identiques si et seulement si ce sont deux copies sans mutation 
d'un même gène ancêtre. 


Principaux paramètres mesurant la consanguinité 


Coefficient de parenté de deux individus (Malecot 1948) : le coefficient de 
parenté yy de deux individus Z et J est la probabilité que deux gènes homologues tirés 
au hasard l'un chez F, l'autre chez J, soient identiques. 

Coefficient de consanguinité d'un individu : f: probabilité que deux gènes 
homologues de l'individu F soient identiques. 

Remarque importante : d'après leurs définitions, le coefficient de consanguinité 
d'un individu Z est égal au coefficient de parenté de ses deux parents (P et M) : 


fi = pm 


Principes du calcul des coefficients de consanguinité et de parenté connais- 
sant le pedigree 


Considérons un individu Z et ses parents P et M 
apparentés par l'ancêtre commun A. A a trans- 
mis une copie de l'un de ses gènes à chacun de A 
ses enfants 8 et C. À chaque génération ulté- 
rieure, ce gène a une probabilité 1/2 d'être trans- 
mis. La probabilité pour que le gène transmis par 
P à I provienne de A est finalement 12}, n1 
étant le nombre de « maillons » de B à I (ou, ce 
qui revient au même, de A à P). De même, la 
probabilité pour que le gène transmis par M à I 
provienne de A est (1/2), n2 étant le nombre 
de « maillons » de Cà I (ou de A à M). 


Ces deux événements sont indépendants. La 
probabilité pour qu'un gène tiré au hasard chez 
Pet un gène tiré au hasard chez M proviennent 
de A est donc {1/2} +2, 
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Cette probabilité assure l'origine commune des deux gènes, mais non leur identité, car 
chez A il y a deux gènes homologues. Les deux gènes transmis à B et C sont soit des 
copies d'un même gène de À (probabilité 1/2), soit des copies de chacun des deux 
gènes homologues de À (probabilité 1/2); dans ce cas, ces deux gènes peuvent être 
quand même identiques, avec une probabilité f4 (coefficient de consanguinité de A). 
Puisque les deux événements sont disjoints, la probabilité que les deux tirages au sort 
donnent des gènes identiques est donc ( 1/2+ 1/2 f,). 


| q ni+n2 1 1 
Nous avons donc : fi = Ôpm = G) E +34) 
dass 1 n+1 
ce qui s'écrit : fi= G) (1 + F4) 


où n(n= n1 + n2) est le nombre de maillons sur la « chaîne de parenté » P-A-M. 


S'il existe plusieurs voies P-A-M par lesquelles P et M ont pu recevoir deux gènes iden- 
tiques, ou plusieurs ancêtres communs à P et M dont ils ont pu recevoir deux gènes 
identiques, la formule se généralise en remarquant que ces situations sont disjointes 
(système complet d'événements : P et M peuvent transmettre à I deux gènes identi- 
ques reçus soit d'un ancêtre, soit d'un autre). On a alors : 


qri+1 
fi = pm = EG) (1 + fa) 


dd T 


E sur toutes les ni: nombre de « maillons » de la j° A;: ancêtre commun à 
chaînes de parenté chaîne de parenté reliant Pà M Pet M pour la chaîne i 


Trois chaînes de parenté de Pà M 
(deux par At, une par 42) 


Il y a autant de chaînes de parenté que de voies par lesquelles deux gènes identiques 
ont pu être transmis à P et M (système complet d'événements). 


Une chaîne de parenté relie les deux individus Pet Men passant par l'ancêtre commun. 


Une chaîne de parenté change une seule fois de direction dans l'échelle des temps : au 
niveau de l'ancêtre commun. 
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Une chaîne de parenté ne peut pas passer deux fois par le même individu. 
Deux chaînes de parenté sont différentes dès qu'elles ont au moins un maillon différent. 


Autres relations permettant de calculer les coefficients de consanguinité et 
de parenté 


Une autre méthode pour calculer les coefficients de parenté, souvent d'un emploi plus 
simple lorsque les généalogies sont compliquées, consiste à «remonter les 
générations ». Il existe en effet des relations simples entre les coefficients de parenté 
de deux individus 7 et J et ceux de leurs parents; en effet, lorsqu'on tire au hasard un 
gène chez J, ce peut être celui reçu de son père Pou celui reçu de sa mère M, avec pour 
chaque cas une probabilité 1/2. Donc : 


du = 1/2(0p, + dun) 


De même, si K et £ sont les deux parents de J : 
Qu = 1/2(rk + $u) 


et en prenant à la fois les parents de 7 et de J (à condition que J ne soit pas le parent 
de Z ou l'inverse) : 


Qu = 1/4(0pr + bpr + Omk + Om) 


On peut continuer à remonter les générations en prenant les parents de P, M, K, L, 
jusqu'à tomber sur des coefficients de parenté connus ou des coefficients de parenté 
d'un individu avec lui-même. En effet, les relations ci-dessus restent valables que P, M, 
K et L soient différents ou non (par exemple si I et J sont frères, P= Ket M= L et: 
dis = 1/410pp + Oum + 20pm] ). En revanche, ces formules ne sont plus valables 
pour calculer le coefficient de parenté d'un individu avec lui-même. Lorsque l'on tire au 
hasard un gène chez Jet un gène chez Z, on peut tirer deux fois le même (probabi- 
lité 1/2) ou les deux gènes de 1 (probabilité 1/2); donc, le coefficient de parenté d'un 
individu 7 avec lui-même vaut : 


Qu = 1/2+1/2(f) 


Quelques résultats classiques 


Coefficients de parenté : 


père/fils 1/4 
pleins-frères 1/4 
demi-frères 1/8 


cousins germains 1/16 
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Lorsque l'on considère deux individus apparentés, leur degré d’apparen- 
tement peut être mesuré par la probabilité qu'ils aient reçu deux gènes iden- 
tiques de leurs ancêtres communs. Plus précisément, lorsque l’on tire au 
hasard un gène chez chacun d'eux au même locus, la probabilité que ces 
gènes soient identiques est appelée le coefficient de parenté de ces deux 
individus. De même, la probabilité qu’un individu consanqguin ait, à un locus, 
deux gènes identiques est appelée le coefficient de consanguinité de cet 
individu. Ces probabilités peuvent être calculées connaissant les relations de 
parenté, c'est-à-dire la généalogie des individus (encadré 3). 

Il peut y avoir consanguinité dans une population d’effectif illimité si les 
croisements ne se font pas au hasard, mais préférentiellement entre appa- 
rentés. En revanche, dans une population d'effectif limité, même si les croi- 
sements se font au hasard, la consanguinité est inéluctable. Le nombre 
d'ancêtres possibles d’un individu étant fini, il suffit de remonter assez haut 
pour trouver un ancêtre commun à ses deux parents. Si on remonte n 
générations plus haut, nous avons chacun potentiellement 2" ancêtres, mais 
ce nombre finit par être supérieur à la taille de l'humanité; en fait, quelques 
individus ancêtres apparaîtront de nombreuses fois dans la généalogie. 


Comme aucune population réelle n'est illimitée, nous pourrions dire que 
tous les individus d’une population, d’une espèce, et même tous les êtres 
vivants, sont apparentés et consanguins: il suffit de remonter assez haut. À 
vrai dire, cette constatation est d’un intérêt limité : sur des généalogies aussi 
longues, de nombreuses mutations ont eu lieu: les gènes dérivés d'un même 
ancêtre commun se sont différenciés et ont cessé d'être identiques. 


3.2.3 L’homogamie 


On appelle homogamie un régime de reproduction où les unions se font 
entre individus phénotypiquement semblables. Comme en régime de consan- 
guinité, il y a diminution du taux d’hétérozygotes à chaque génération. 

Supposons que le phénotype soit gouverné par un couple d’allèles A et 
a; il existe, au départ, trois génotypes : AA, Aa et aa. 

S'il ny a pas de dominance, ces génotypes correspondent à trois 
phénotypes; les accouplements se font donc entre individus ayant le même 
génotype, et le résultat est identique à celui obtenu par autogamie : les hété- 
rozygotes diminuent de moitié à chaque génération. Mais ici, contrairement 
à l'autogamie, seul ce locus est concerné. 

S'il y a dominance de A sur a, les individus aa se reproduisent entre 
eux et donnent des descendants identiques à eux-mêmes. Le groupe des indi- 
vidus AA et Aa (même phénotype [A]) produit trois types de croisements : 
AA x AA, AA x Aa et Aa x Aa. Ce dernier type de croisement donne des 
individus aa qui rejoignent l’autre groupe. La fréquence de a diminue donc 
dans ce groupe [A]; progressivement, il se «purifie » de ses allèles a qui 
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passent dans l'autre groupe, mais, sur l’ensemble de la population, les fré- 
quences alléliques restent constantes. Le taux d’hétérozygotes décroît, mais 
plus progressivement que dans le cas précédent (lorsque l’allèle a se fait rare 
dans le groupe [A], les croisements Aa x Aa deviennent très rares, de sorte 
que l'élimination du gène a dans ce groupe devient très lente). Néanmoins, à 
terme, il ne reste, encore ici, que des homozygotes AA et aa, en fréquences p 
et q. 


#  L'autogamie, la consanguinité et l'homogamie, pourvu qu'elles soient pratiquées de 
façon absolue par la population, conduisent progressivement à l'homozygotie totale. La 
panmixie, en revanche, amène un taux d'hétérozygotes de 2pq en une seule généra- 
tion (dans le cas d'une population à générations séparées). Un régime mixte (autoga- 
mie partielle, homogamie partielle...) comprenant une fraction de croisements en 
panmixie ne peut donc jamais conduire à l'homozygotie totale de la population, car la 
fraction panmictique, aussi faible soit-elle, provoque, à chaque génération, l'apparition 
d'hétérozygotes. 


3.3 UN RÉGIME OUVERT : L'HÉTÉROGAMIE 


L'hétérogamie est un régime de reproduction où les unions se font 
entre individus phénotypiquement dissemblables (on parle parfois aussi 
d’« homogamie négative »). Cela entraîne un taux d’hétérozygotes supérieur 
à 2pq. 

Ce régime concerne notamment les gènes sexuels (ou parasexuels). Ainsi 
chez les mammifères, le sexe mâle est déterminé par la formule chromoso- 
mique XY, et le sexe femelle par la formule XX. 


En considérant X et Y comme des allèles, la fréquence de X est égale à 
3/4, celle de Y à 1/4; le taux d’hétérozygotes en panmixie serait de 
2pq = 2 x (1/4) x (3/4) = 3/8. Il est en fait plus élevé : 1/2 (proportion des 
mâles). Chez les plantes, les systèmes d’auto-incompatibilité (gamétophyti- 
que ou sporophytique) ont aussi pour effet d'interdire tout ou partie des 
fécondations entre porteurs des mêmes gènes au locus d'incompatibilité, ce 
qui entraîne une hétérozygotie élevée pour ce locus. 

L'hétérogamie a une particularité parmi les régimes de reproduction : à la 
différence des autres modes de reproduction dont nous avons parlé auparavant, 
l'hétérogamie modifie non seulement la structure génotypique, mais aussi la fré- 
quence des allèles dans la population. Ainsi, chez les mammifères, la fréquence 
des chromosomes X et Y est maintenue à (3/4 : 1/4). Cette particularité tient 
à ceci : si pour une raison ou une autre, les individus reproducteurs d’un sexe 
sont moins fréquents que ceux de l’autre sexe à une génération, ce sont eux qui, 
en moyenne, se reproduiront le plus. L’hétérogamie entraîne donc une forme 
spéciale de sélection qui favorise les gènes de la forme la plus rare, ce qui les 
maintient à une fréquence d'équilibre précise. 
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D'autre part, l’'hétérogamie « protège » les loci concernés contre l'homo- 
zygotie due à la consanguinité. Par exemple, des croisements frère-sœur ne 
modifient pas la proportion de femelles (XX) et de mâles (XY). 


3.4 REMARQUES 


1) Les régimes décrits ci-dessus sont des schémas que l'on peut dégager 
des principales tendances qui existent dans la nature. En fait, les situations 
réelles ne se conforment jamais qu'approximativement à ces schémas. C'est 
ainsi qu'il est probable que l’autogamie stricte n'existe pas; que l’on constate 
une tendance homogamique dans le choix des conjoints pour quelques 
caractères chez beaucoup d'espèces à panmixie prédominante... Il n’en est 
que plus remarquable de constater que chaque espèce semble avoir « choisi » 
une tendance prédominante. Ainsi, les plantes à fleurs se partagent schéma- 
tiquement en trois grandes catégories : les plantes dites autogames, où 
l’autofécondation prédomine, les allogames qui se reproduisent principale- 
ment en croisement (on peut considérer alors qu’il y a panmixie pour la 
plupart des locus) et les plantes à reproduction asexuée (multiplication 
végétative ou apomixie). . 

2) Le régime de reproduction ne peut être défini, à part pour l’autogamie 
ou la consanguinité, que pour un locus déterminé, et il peut parfaitement 
varier d’un locus à l'autre. Dans les populations humaines par exemple, il y a 
hétérogamie pour le sexe, une certaine homogamie constatée pour les gènes 
de la couleur de la peau, et à peu près panmixie pour les groupes sanguins. 


3) On constate que les régimes de reproduction influencent fortement la 
structure génotypique, en déterminant si les gènes homologues s'associent 
dans les zygotes plutôt entre gènes semblables (régimes fermés) ou dissem- 
blables (régimes ouverts); mais, mis à part le cas particulier de l’hétérogamie, 
ils n'ont pas d’effet par eux-mêmes sur les fréquences alléliques (fig. 1). Ce 
dernier point doit cependant être nuancé : il est vrai tant que le régime de 
reproduction est le seul facteur en cause. Mais si une sélection s'exerce qui, 
par exemple, élimine les homozygotes aa, il est clair que la vitesse d'élimi- 
nation du gène récessif a de la population dépendra fortement du régime de 
reproduction : elle sera plus rapide avec un régime fermé qu'en panmixie ou 
en régime ouvert, où beaucoup de gènes a échapperont à la sélection parce 
qu'ils sont masqués dans les hétérozygotes. 

4) Nous avons classé les régimes de reproduction selon la fréquence 
d'hétérozygotes par rapport à 2pq. L'écart à cette fréquence peut être 
exprimé par un paramètre appelé indice de fixation de la population : soit 
une population avant, pour un locus à deux allèles (A, a), une structure géno- 
typique absolument quelconque : 

Génotypes AA Aa aa 


Fréquences génotypiques D H R 
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population de gamètes 


population de gamètes 
(génération g) 


(génération g -1) 


Fréquences Fréquences 
alléliques : p, q alléliques : p, q 


Population de zygotes obtenue pour 
trois types de régime de reproduction 


Figure 1 : Le régime de reproduction détermine l'association des 
gènes homologues dans les zygotes, mais il est sans effet, par lui- 
même, sur les fréquences alléliques (les deux types de points symbo- 
lisent les deux allèles). 


On définit l'indice de fixation comme : 


SH =(1-F).2pq 


Fef-1:+1]}:F = 0 si la structure est celle de Hardy-Weinberg. 


Or p=D+5H=D=p-3H=p-patl-F) 


p(1-q)+pqF = p° +pqF 


1i 


R+1/2H=R = q-1/2H = q-pq(1 -F) 
= a(1-p)+pqF = q° + pgF 


© 
Il 


D = p’ +Fpq = (1-F)p°+Fp AA 
H = (1-F)(2pq) Aa 
R - q? +Fpq = (1-F)q° +Fq aa 
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Cette structure est parfois appelée structure de Wright. Quelle que 
soit la structure génotypique de la population, elle peut toujours s'écrire sous 
cette forme : connaissant D, H et R, on peut toujours calculer p et F. Inver- 
sement, ces deux paramètres suffisent à spécifier entièrement la structure 
génétique : connaissant p et F, les fréquences génotypiques D, H et R sont 
totalement déterminées. F représente l'information qui nous manquait pour 
déduire la structure génotupique de la structure allélique. L'intérêt de l’écri- 
ture sous cette forme est qu’elle permet de bien séparer ce qui, dans la struc- 
ture génotypique, dépend des fréquences alléliques (p et q) et ce qui dépend 
de la façon dont les gènes sont associés (F, qui mesure un écart à la struc- 
ture de Hardy-Weinberg). On peut montrer aussi que, si la structure géno- 
typique est observée au stade zygote, F n’est autre que le coefficient de 
corrélation entre les gamètes qui s'unissent. C’est d’ailleurs ainsi que F a 
d'abord été défini par Wright, sous le nom de « coefficient de consangui- 
nité de la population ». En fait, ce terme est abusif, car F ainsi défini n’a la 
signification d’un coefficient de consanguinité que dans la mesure où la 
consanguinité est bien le seul facteur induisant un écart à la structure de 
H.W. dans la population. D'autre part, un apparentement généralisé (cas 
des populations finies) ne provoque pas d'écart à H.W. Même si l’on consi- 
dère la structure au stade zygote, une corrélation, et donc un écart à la struc- 
ture de H.W., peuvent être provoqués par d’autres facteurs, l’'homogamie 
par exemple. Si et seulement si la consanguinité est le seul facteur en jeu 
(toutes les autres conditions de la loi de Hardy-Weinberg sont remplies), F 
est égal à la moyenne des coefficients de consanguinité f des individus de la 
population (notion définie à partir du concept d'identité). Autrement dit, F 
est alors la probabilité de trouver à un locus deux gènes identiques chez un 
individu tiré au hasard dans la population : 


F = f e [0;1] 


et dans l'écriture de la structure génotypique, F peut être remplacé par f. 
Dans ce cas, on peut d’ailleurs retrouver la structure de Wright par un autre 
raisonnement : lorsque l’on tire un individu de la population, ses deux gènes 
sont identiques avec une probabilité f, et ils sont alors AA avec une proba- 
bilité p et aa avec une probabilité q; les deux gènes sont non identiques avec 
une probabilité (1 — f), et sont alors AA, Aa ou aa avec les probabilités p°, 
2pq, q? respectivement. D'où la structure : 


AA: Q-fp° +fp 
Aa: (1-f).2pq 


aa : (1- fa? +fa 
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Mais ce raisonnement n’est plus valable dès que l'on sort du cadre strict 
des hypothèses ci-dessus, parce que si d’autres facteurs que la consanguinité 
interviennent, ou si la consanguinité peut être due à un apparentement 
généralisé, les gènes non identiques ne sont plus forcément indépendants. 


Influence 
des pressions évolutives 


Nous appelons pression évolutive une action qui s'exerce sur la popu- 
lation en en modifiant la structure allélique. 


Il en existe quatre types, correspondant à l’abandon de diverses hypothè- 
ses de la loi de Hardy-Weinberg : 


e le hasard lié à un effectif fini, 


e la sélection, si certains gènes ont une influence sur la viabilité ou sur 
l'efficacité de la reproduction, 


e la mutation, 


e la migration. 


4.1 LE HASARD 


Il n'existe pas de populations d’effectif infini (tout au plus existe-t-il des 
populations suffisamment grandes pour que l’on puisse les considérer 
comme pratiquement infinies sur un court laps de temps). Or, dans une 
population finie, les gènes portés par les gamètes qui donnent naissance à 
une génération représentent un échantillon des gènes de la génération pré- 
cédente. La loi des grands nombres ne s'applique plus. Même si, en espé- 
rance, on attend la même fréquence des allèles qu'à la génération 
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précédente, cela ne sera réalisé que de façon approximative du fait des effets 
d'échantillonnage liés à l'effectif fini; ces effets peuvent être importants, sur- 
tout si la population est petite. Comme cela se reproduit à chaque généra- 
tion, et que rien ne tend spécialement à nous ramener aux fréquences 
d’origine, ces effets cumulés sur de nombreuses générations peuvent devenir 
considérables. L'effet d'échantillonnage introduit donc une variation aléa- 
toire de la fréquence des gènes au fil des générations. Cette fluctuation est 
appelée dérive génétique. 

Considérons une population diploïde à générations séparées, ayant une 
taille constante de N individus. Mise à part la taille, toutes les autres condi- 
tions de la loi de Hardy-Weinberg sont supposées satisfaites (population iso- 
lée, sans sélection ni mutation). Soit pọ la fréquence du gène A dans la 
génération de départ. La génération diploïde suivante représente un tirage 
au hasard de 2N gènes. Le nombre X; de gènes À dans cette nouvelle 
génération est une variable aléatoire dont la loi est une binomiale de para- 
mètres 2N et po, d’où : 


E(X) = 2Npo 
Var(X:1) = 2N.po.(1 -Po). 


La proportion de gènes À dans la nouvelle génération est : 


Pı = X3/2N 
Elle a donc pour espérance : 
E(p5) = Po 
et pour variance : 
(1-po) 
Var(p;) = — 


Si l'on maintient constante la taille N de la population, on peut démon- 
trer par récurrence qu'après g générations, la fréquence p, de À est une 
variable aléatoire d'espérance : 


et de variance : 


Var(p,) = PoC -Po1-(1-1/2N)°] 
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Cela signifie que si l’on menait une infinité de populations de même taille 
en parallèle, à partir d'une même population de départ, la fréquence 
moyenne de À sur l’ensemble des populations resterait égale à la fréquence 
initiale po, mais que la fréquence de A varierait de façon erratique dans cha- 
que population et que les populations divergeraient (fig. 2). La variance ci- 
dessus représente la variance interpopulations, qui augmente au cours des 
générations, et ce d'autant plus vite que N est petit. Par ailleurs, la variance 
mesure, par définition, l'espérance des carrés des écarts à la moyenne; 
comme cette moyenne est E(p;) = Po : 


2 
Var(ps) = E(P- Po) 
La variance mesure donc aussi l'ampleur des écarts attendus par rapport 
à la fréquence initiale po. 
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Figure 2 : Fluctuations aléatoires de la fréquence d'un gène dans une 
série de populations ayant au dépaït la même fréquence allélique (p ). 


En fait, la fréquence du gène ne va pas fluctuer indéfiniment. Dans une 
population, elle augmente ou elle diminue, mais comme rien ne tend à 
ramener la population vers des fréquences moyennes, tôt ou tard, elle 
atteindra 1 ou 0, c'est-à-dire que l’on ne tirera que des gènes À ou que des 
gènes a. En l'absence de mutations, cette fixation aléatoire d'un des allèles 
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est définitive; si la fréquence p, prend la valeur O ou 1, elle la garde : les 
valeurs O et 1 constituent des « bords absorbants ». Sur l'ensemble des 
populations envisagées plus haut, on tend vers l’'homogénéité de chaque 
population, mais il y a, comme nous l'avons dit, une différenciation crois- 
sante entre les populations, certaines fixant A, d’autres a, de sorte que la 
diversité allélique est globalement maintenue. Plus précisément, comme on 
sait que E (p) est toujours égale à ps, on en déduit qu’à la limite, p = 1 avec 
la probabilité ps, et p = O (q = 1) avec la probabilité 1 - pọ. En d’autres 
termes, si un allèle est présent dans une population en fréquence pọ, il va 
envahir la population sous le seul effet du hasard avec une probabilité po, ou 
disparaître avec une probabilité (1 — po). 


Ce phénomène de dérive se produit à une vitesse proportionnelle à la 
décroissance du terme (1 — 1/2N$; il est donc d'autant plus rapide que la 
taille de la population est petite. Une population de petite taille a beaucoup 
plus de chances d'être rapidement. homogénéisée par la dérive qu'une 
grande population, et ce pour l’ensemble des locus. De plus, une population 
réelle, composée de N individus, n'évolue généralement pas comme une 
population idéale de même effectif. Le plus souvent, la population réelle doit 
être comparée à une population idéale d’effectif N,, appelé effectif géné- 
tique, inférieur à l'effectif réel (encadré 4). 


Il est important de noter que, même si d’autres forces que le hasard agis- 
sent sur les fréquences des gènes, celui-ci agit toujours. Comme aucune 
population n'est infinie, et que dans les populations naturelles, la dérive a eu 
tout le temps de jouer, on pourrait penser que ces populations sont fixées 
pour la plupart de leurs locus. En fait, ce n’est généralement pas le cas, 
parce que la mutation et la migration réintroduisent de nouveaux allèles, et 
que, pour certains gènes, la sélection opère et peut s'opposer à l'homogé- 
néisation. Nous aurons l’occasion de revenir sur cette question. 

Les populations naturelles ont rarement des effectifs constants. La dérive 
va jouer surtout dans les périodes où les effectifs sont faibles. Si à une épo- 
que de son histoire, une population est passée pendant plusieurs généra- 
tions par un effectif très faible, elle a pu perdre par dérive, pendant cette 
période de « goulot démographique », une grande part de sa diversité alléli- 
que. Elle ne pourra la récupérer ensuite qu’en recevant des gènes d'autres 
populations, ou par mutation, mais cela est forcément très lent étant donné 
la faiblesse des taux de mutation. C’est par de tels goulots démographiques 
que l’on interprète généralement les quelques cas connus d'espèces qui ont 
une diversité allélique nulle à tous leurs locus. Tel est le cas, par exemple, de 
l'Éléphant de Mer de la côte ouest de l'Amérique du Nord : on met cela en 
rapport avec une très forte réduction des effectifs due à une chasse excessive 
au XIX? siècle, qui a amené cette espèce au bord de l’extinction : la dérive a 
dû alors jouer de façon considérable, et là, il n°y a pas d’autres populations 
qui auraient pu fournir des migrants. 
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ENCADRÉ 4 : NOTION D'EFFECTIF GÉNÉTIQUE 


Dans une population idéale, satisfaisant aux conditions du modèle de Hardy-Weinberg, 
composée de N individus diploïdes (2N gènes), chaque individu a la même probabilité 
de participer à la constitution de la génération suivante, ce qui permet de dire par 
exemple qu'un même gène sera tiré deux fois avec une probabilité 1/2N. Dans une 
population réelle de N individus diploïdes il n'est souvent pas possible de tenir le même 
raisonnement, les formules établies précédemment ne s'appliquent plus. 


Pour décrire l'évolution d'une population réelle, il est possible de recalculer les formules 
en tenant compte des écarts au modèle idéal, mais cela sera souvent compliqué. On 
choisit plutôt de déterminer l'effectif génétique de la population réelle, noté M, , défini 
comme l'effectif d'une population idéale présentant la même évolution, notamment en 
termes de coefficient de consanguinité f que la population réelle. M, sera différent de 
N, et généralement inférieur. Nous allons considérer plus particulièrement deux cas, 
lorsqu'une population est de taille variable ou si les femelles et les mâles ne sont pas 
en nombre égal. 


e Dans une population idéale de taille X nous avons vu que f, coefficient de consan- 
quinité à la génération g, s'exprimait simplement en fonction de f,_; ou f et N(para- 
graphe 4.2). Supposons qu'une population, sur deux générations, passe d'une taille M, 
à une taille W,, on aurait alors : 


1-f = (-1/2A)0- h) et 1-6 = (1-1/2) -h) 
soit 1-f = (1-172041 -1/200 - h). 
Dans une population idéale, on aurait 1- f = (1-1/2N.)/(1-#). 


Par conséquent : (1-1/2N)? = (1-1/2N,)(1-1/2A)). 


Cette formule est bien approchée par l'expression : 17N, = 1/2(1/N;+1/N,). 
N, est la moyenne harmonique entre N, et W.. 


Ceci se généralise à une population qui comprend N; individus à la génération 4 Cette 
population est alors équivalente, après g générations, à une population idéale d'effectif 
N, tel que : 


e Considérons le cas d'une population d'individus à sexes séparés. À chaque généra- 
tion, la moitié des allèles provient de chaque sexe. Par conséquent, dès que l'on 
s'écarte d'une situation où les deux sexes sont également représentés, le risque de 
dérive génétique augmente. Si la population comporte Nęfemelles et W,, måles, un indi- 
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vidu aura forcément deux parents différents, un mâle et une femelle. Il ne pourra être 
issu de l'union entre deux gamètes provenant du même individu que si celui-ci est l'un 
de ses grands-parents. Cela se produira lorsque ses deux parents lui transmettront le 
même gène qu'ils auront eux-mêmes hérité de leur père, avec une probabilité 1/8, et 
que ces deux parents auront le même père, avec une probabilité 1/ M. Le raisonne- 
ment est symétrique avec la mère. La taille réelle de la population sera donc 
N= N+ Np mais sa taille génétique N, s'écrira (sachant que la probabilité pour que 
les deux gènes soient des copies du même gène de la génération précédente dans une 
population idéale est 1/2N) : 


RE 1 _ ANAN; 


2N, ENS EN; © T Nm +N; 
Si une population comporte le même nombre d'individus de chacun des deux sexes, 
son effectif réel est égal à son effectif génétique. Mais dès que ces nombres sont iné- 
gaux, l'effectif génétique est toujours plus faible que le nombre d'individus total de ta 
population. 


Un cas particulier de dérive lors de goulot démographique est l'effet de 
fondation : quelques migrants, voire un seul chez une espèce hermaphro- 
dite, sont à l’origine d’une nouvelle population là où l'espèce n’était pas 
présente. Ils peuvent, par le hasard de l’échantillonnage, représenter un 
échantillon d’allèles très différent de la composition de la population dont ils 
sont issus. La nouvelle population qui se développe à partir de ce noyau 
fondateur aura donc une structure génétique sensiblement différente de la 
structure d’origine. Selon certains évolutionnistes, ce phénomène pourrait 
jouer un rôle important dans la formation de nouvelles espèces. 

Dans notre modèle, nous avons envisagé la dérive pour une population 
diploïde, sexuée et panmictique, mais elle se produit de même dans toute 
population finie où de nouveaux individus naissent tandis que les anciens 
disparaissent. 

La seule chose qui soit propre au type de population que nous avons 
choisi est l’évolution du taux H d’hétérozyaotes. 


4.2 ÉVOLUTION DE LA FRÉQUENCE DES HÉTÉROZYGOTES 


Dans une population diploïde et panmictique, la fréquence espérée 
d'hétérozygotes Aa à une génération est 2Pales Pg et q, étant les fréquences 
alléliques dans les gamètes qui s'unissent pour former les zygotes (en fait, à 
cause des aléas de l’échantillonnage, cette proportion 2p,44 ne sera réalisée 
qu'approximativement). 


E(H) = El2p,(1-p,)1 = 2IE(p4) - E(p?)] 
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Or Var(p,) = Ets) - LEPa)? 


et E(p,) = Po 


Var(p,) = potl-Pol1-(1-1/2N)1] 


d’où E(p?) = pol -pol1-(1-1/2N)1+p6 


| E(H) = 2po(1 - po)(1 -1/2N)° 


Quand g augmente, (1-1/2N)°tend vers 0, et 


Les hétérozygotes tendent donc à disparaître. En fait, ils restent à chaque 
génération en fréquence approximative 2pq, puisqu'il y a panmixie, mais le 
produit pq tend vers zéro parce que p tend vers 0 ou q tend vers 0 (fixation), 
ainsi que nous l'avons vu. 


4.3 DÉRIVE GÉNÉTIQUE ET CONSANGUINITÉ 


Ces deux phénomènes, que nous avons jusqu'ici séparés, sont liés dans 
la pratique, car la consanguinité est inéluctable dans les populations d'effec- 
tif limité. 

On peut illustrer simplement la liaison entre effectif limité et 
consanguinité : soit une population de N individus diploïdes (2N gènes). 
Chacun des individus produit une infinité de gamètes. La génération sui- 
vante sera constituée par le tirage de 2N gamètes dans le pool de gamètes 
de la génération précédente. Si l’on suppose que les 2N gènes des individus 
de la génération de départ sont non identiques, le coefficient de consangui- 
nité à la génération Q vaut : 

fo = 0 

Calculons le coefficient de consanguinité f, de la génération g. La pro- 
babilité que les deux gamètes qui formeront un individu à la génération g 
portent à un locus donné une copie d’un même gène de la génération pré- 
cédente est 1/2N. Ils sont alors identiques avec une probabilité de 1. Si les 
deux gamètes portent des copies de gènes distincts de la génération {g - 1) 
(probabilité 1 - 1/2N), ils sont alors identiques avec une probabilité f, 1 
(coefficient de consanguinité à la génération précédente). 
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On a alors : 
fe = A/2N)+(1-1/2N)f, 1 
ce qui peut s'écrire : 
(-f,) = (-1/2N)(1-f, 1) = (1-1/2N)(1- fo) 


d’où, puisque fo est nul : 


f,=1-(1-1/2N) 


Le coefficient de consanguinité augmente donc d’autant plus vite que la 
taille de la population est petite. La valeur calculée n’est bien sûr exacte 
qu'en espérance, puisque le hasard des tirages va jouer. 


À terme, on arrive à f = 1. Ce calcul nous montre que les choses sont 
encore pires, en quelque sorte, que ce que nous avait montré le calcul sur la 
dérive : non seulement on perd la diversité allélique, mais même tous les 
gènes de la population, au locus considéré, finissent par être des copies d’un 
seul des gènes de la population de départ. En d'autres termes, si l’on 
remonte assez haut dans le temps, on trouvera un seul gène ancêtre de tous 
les gènes actuellement présents à un locus dans une population (fig. 3). 
Comme nous avons eu l’occasion de le dire à propos de la consanguinité, la 
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Figure 3 : Le « coalescent » montre que de nombreuses lignées s'étei- 
gnent et que tous les allèles présents en fin de processus remontent à 
un ancêtre unique situé quelque part dans le passé. 
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mutation peut bien sûr avoir réintroduit une diversité entre ces gènes, mais 
il n’en demeure pas moins qu'il y a bien un gène ancêtre unique pour chaque 
locus. Ce phénomène est appelé la coalescence des gènes d’une popula- 
tion. Elle existe pour tous les locus, mais le gène ancêtre pour un locus se 
trouvera généralement dans un autre individu que le gène ancêtre d’un autre 
locus, et à une époque différente. En fait, comme il peut y avoir eu des 
recombinaisons à l’intérieur des gènes, même des portions de gènes adja- 
centes peuvent dériver d'ancêtres différents. 

Il s’agit d’un phénomène aléatoire; tant qu'il n'y a pas de sélection, tous 
les gènes présents à un moment donné ont la même probabilité (1/2N) 
d'être l'heureux gagnant, le futur ancêtre de tous les gènes qui seront dans 
la population bien des générations plus tard. On ne peut pas non plus dire 
précisément combien de temps cela prend; ce temps de coalescence est 
une variable aléatoire. Néanmoins, on peut en calculer l'espérance : on 
montre que, pour k gènes, il faut remonter en moyenne 2k générations 
pour trouver un seul ancêtre commun à tous. Pour une population diploïde 
ayant un effectif constant de N individus, soit 2N gènes par locus, cela nous 
fait remonter à 4N générations, en espérance. De la même façon, il faudra 
attendre 4N générations, en moyenne, pour qu'il ne reste des copies que 
d'un seul des 2N gènes présents à un moment donné. 


4.4 LA SÉLECTION 


La sélection naturelle et son effet sur l'évolution des populations sont 
l'hypothèse centrale de la théorie de Darwin. Les généticiens des popula- 
tions ont introduit cette idée dans leurs modèles à travers le concept de 
valeur sélective d’un génotype. 


4.4.1 Notion de valeur sélective 


Chaque génotype est affecté d'un paramètre nommé valeur sélective. 
L'idée est qu'un génotype est d'autant meilleur que les individus 
possédant ce génotype laissent en espérance plus de descendants 
(puisque c'est vers cela que sont finalisés les êtres vivants). 

La valeur sélective d’un génotype, notée ici w, est donc mesurée par le 
nombre de descendants laissés par les zygotes porteurs de ce génotype à la 
génération suivante. On peut aussi compter le nombre de gamètes produits 
qui ont participé à la formation des zygotes de la génération suivante, ce qui 
revient au même à un facteur 2 près. 


La valeur sélective d’un génotype peut être décomposée en deux facteurs : 


e la viabilité (notée v) représentant la probabilité pour un zygote ayant 
ce génotype d'arriver à l’âge reproducteur; 
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+ la fertilité (notée f) qui est le nombre moyen de zygotes qu'il laisse à la 
génération suivante (ou de gamètes participant à la génération suivante). 


On a alors : 


w = v.f 


4.4.2 Évolution d’une population soumise à la sélection 


Considérons une population possédant, pour le locus étudié, deux allèles, 
A et a. Trois génotypes sont possibles : AA, Aa et aa; on leur affecte des 
valeurs sélectives : w1, w et wz respectivement. 

Soit p la fréquence de l'allèle A, et q = 1 - p la fréquence de a dans la 
population gamétique. Si l’on suppose la panmixie, les zygotes produits 
seront répartis comme suit : 

Génotypes AA Aa aa 

Fréquences p 2pq q 

S'il y a des différences de viabilité entre génotypes, ces proportions vont 
se trouver modifiées chez les adultes reproducteurs. Par ailleurs, s’il y a des 
différences de fertilité, certains produiront plus de gamètes participant à la 
génération suivante que d’autres. 

En définitive, étant donné les différences de viabilité et de fertilité entre 
ces trois génotypes, la proportion des gamètes A produits est : 


, 


wp + 1/2.w3.2pq 
w 


où w = wi. p + 2w:.pq + w3.q° représente la valeur sélective moyenne de 
la population (les valeurs sélectives de chaque génotype multipliées par leur 
fréquence), c’est-à-dire la quantité moyenne de zygotes de la génération sui- 
vante (ou de gamètes participant aux fécondations) formés par zygote. 

On peut alors calculer la variation de la fréquence de l’allèle A d’une 
génération à la suivante sous l’effet de la sélection : 


2 
w.p +Wo2.pq 
w 


Ap =p'-p= 


ce qui se transforme (en réduisant au même dénominateur et en se 
souvenant que p + q = l)en: 


(w; -w2)p + (w2 - w3)q 


Ap = pq 2 2 
w.p + 2Wo2.pq +Wa3.q 


Principales notions de génétique des populations 35 


On constate que, dans l’évolution de la fréquence allélique, les valeurs 
absolues des w n'interviennent pas : on pourrait toutes les multiplier ou les 
diviser par une même quantité. Cela nous confirme qu'il est indifférent de 
mesurer la valeur sélective par le nombre de zygotes formés ou par le nom- 
bre de gamètes utiles. Souvent aussi, par convention, on affecte une valeur 
arbitraire de 1 à l’une des valeurs sélectives (par exemple la plus grande), et 
on exprime les autres par rapport à celle-ci (un génotype ayant une valeur 
sélective de 0,8 sera alors un génotype dont la valeur reproductive est égale 
à 80 % de celle des meilleurs : quand ceux-ci laissent 1 descendant, le géno- 
type considéré n’en laisse que 0,8). Cela ne change rien pour le calcul de 
l'évolution des fréquences alléliques; simplement les valeurs sélectives ne 
représentent plus un nombre absolu de descendants. 

Le signe de Ap nous donne le sens de l’évolution : si Ap est positif, cela 
signifie que la fréquence p de A augmente du fait de la sélection; Ap < 0 
indique que p diminue; Ap = 0 correspond à un équilibre. Puisque w est 
toujours positif, que pq > O, le signe de Ap est celui du numérateur. Il dépend 
bien sûr des valeurs sélectives. En écartant le cas où w4 = wọ = wg, qui signi- 
fie qu'il n'y a pas de sélection (et dans ce cas c'est le hasard qui opère), on 
peut envisager les situations suivantes : 


e w > wg > wz correspond au cas où les génotypes AA se reproduisent 
davantage (ils sont plus viables et/ou plus fertiles) que les Aa, eux-mêmes 
meilleurs que les aa. Dans ce cas Ap est toujours positif; le gène À augmente 
en fréquence jusqu'à p = 1 (et q = 0; Ap devient alors nul : c'est l'équilibre). 
kci, clairement, il y a un gène favorable, À, qui élimine le gène défavorable 
a. La situation est la même si w] = w, > wz ou si & > Wọ = W3. 

e Le cas symétrique est w, < wọ < wz: Ap est négatif; la sélection 
amène à la fixation de l’allèle favorable a. 

e Les cas w, > Wz < w; (l'hétérozygote est inférieur aux deux homo- 
zygotes) et w, < w, > wz (l'hétérozygote est supérieur aux deux homo- 
zygotes) sont plus complexes : il existe une valeur particulière de p différente 
de 0 et 1 qui annule le numérateur, c'est-à-dire qu'il peut exister un équilibre 
où les deux allèles se maintiennent. Nous aurons l’occasion d'explorer plus 
en détail cette situation. 


# Ce modèle a l'avantage d'être simple, mais les paramètres qu'il utilise, fréquences allé- 
liques chez les zygotes ou les gamètes, valeurs sélectives, sont très difficiles à estimer 
dans les populations. Il y à à cela diverses raisons : 


e On n'a presque jamais accès aux zygotes ni aux gamètes. On ne peut donc connaître 
les fréquences à ces stades; on peut, tout au plus, regarder chez les jeunes en espérant 
qu'il n’y a pas eu de sélection auparavant. Or une éventuelle élimination précoce de 
zygotes est difficilement détectée, et plus encore une sélection sur les gamètes. 
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e La connaissance de la structure chez les adultes est généralement insuffisante : à ce 
stade, les génotypes sont en fréquences attendues : 


2 2 
vp 2v,pq q 
v v v 
mais on ignore ce que valent p et q (valeurs chez les zygotes), puisque les fréquences 
alléliques chez les adultes ne sont plus les mêmes. En fait, on a trop d'inconnues. 


e Par ailleurs, tout cela ne nous dit rien sur d'éventuelles différences de fertilité. S'il y 
en a, les fréquences chez les adultes ne reflètent pas non plus celles des gamètes et des 
zygotes qui seront produits. 

e |! faut donc des études démographiques précises pour estimer les viabilités et fertili- 
tés. II faut comparer de nombreux individus des divers génotypes pour s'abstraire des 
effets aléatoires : dans une population, il y a toujours des individus qui se reproduisent 
plus que d'autres, ce n'est pas forcément dû à la sélection; il faut montrer que les dif- 
férences constatées sont bien dues au génotype. 


e On se heurte à une difficulté encore plus sérieuse : la valeur sélective d'un individu 
dépend de son génotype sur l'ensemble de son génome. Si l'on décèle des différences, 
il est difficile d'affirmer qu'elles sont causées par le génotype au locus considéré, et pas 
à d'autres gènes. 

+ Enfin, la valeur sélective dépend du milieu : un génotype peut être favorisé dans un 
milieu et pas dans un autre. Or le milieu naturel est variable... ! 


4.5 LA MUTATION 


La mutation est une erreur dans la reproduction conforme du 
message héréditaire. Elle va transformer un allèle en un autre, nouveau ou 
déjà présent dans la population. Du point de vue du généticien des popula- 
tions, les mutations qui importent sont celles qui se produisent dans la lignée 
germinale. Il s'intéresse donc à des taux de mutation par génération. 

Si le gène À, en fréquence p, se transforme en a à chaque génération 
avec une fréquence u (taux de mutation), alors que le taux de réversion est 
négligeable, la fréquence de A à la génération suivante est : 


p'=(l-u)p 


La variation de la fréquence de A d’une génération à l’autre, due à la 
mutation, est : 


Ap = p'-p = -up 
Après g générations : 


Pa = (l-u)? Po 
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Pour que p ait diminué de moitié, le nombre g de générations nécessaire 


est tel que : < 
i 
Pa = 35 Por a- do 
soit d-u = 5 
d'où -Ln2 n2 0.7 
ou = ——— =z — 7 


Pour u = 10 6, on trouve g = 700 000. Ce chiffre correspond, chez 
Phomme et ses ascendants, à une durée approximative de 10 à 20 millions 
d'années (ce qui nous ramène dans l'ère tertiaire). 


ll est clair qu'une force qui prend autant de temps pour diviser 
simplement la fréquence d'un gène par deux ne peut pas avoir, par ce 
moyen, joué un rôle important dans l'évolution. Le rôle de la mutation est 
négligeable sur l’évolution de la fréquence des gènes, comparé à celui des 
autres pressions évolutives. 


En fait le rôle de la mutation dans l’évolution est primordial, mais il est 
autre : c'est la seule source de gènes nouveaux. Mais une fois qu'un 
nouveau gène est apparu par mutation, ce n’est plus elle qui va déterminer 
son devenir : si le nouvel allèle est défavorable, ou s’il est plus favorable que 
les anciens, c'est principalement la sélection qui va déterminer l'évolution 
ultérieure de sa fréquence. Si le nouvel allèle ne présente ni avantage ni 
désavantage, c’est la dérive qui interviendra. 


# La mutation n'est pas toujours unilatérale; il peut exister des mutations reverses. 
Ainsi, supposons que le gène A mute en son allèle a avec une fréquence u, et que a 
mute en A avec une fréquence v. La pression de mutation devient : 

Ap=-up+v(i-p}=v-plu+v 
Cette formule peut évidemment s'annuler (pour p = v/{u + V), ce qui implique que ce 
système peut à lui seul mener à un équilibre stable. Cependant, l'influence de la 
pression de mutation sur les fréquences est si faible (voir ci-dessus) que ces fréquences 
ne peuvent rester constantes sous l'action de ces seules forces; d'autres pressions plus 
fortes (par exemple la dérive) vont venir modifier la structure de la population et on ne 
peut pas vraiment considérer qu'il s'agit là d'un équilibre. 


4.6 LA MIGRATION 


La migration est le passage de gènes d’une population dans une 
autre (par des individus qui passent d’une population à l’autre, par exemple 
sous forme de graines ou de pollen chez les plantes). Si cet échange se fait 
entre des populations avant des fréquences alléliques différentes, elle va 
tendre à modifier les fréquences alléliques : c'est bien une pression évolutive. 
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Le modèle le plus simple pour mettre en évidence le rôle de la migration 
est le modèle dit « en île » : soit pi, fréquence d’un allèle dans la population 
étudiée (l« île »), et pe, la fréquence de cet allèle chez les immigrants (que 
nous supposerons en proportion m par génération); alors : 


pi=(l-m)-p;+m-p, 
L'écart des fréquences alléliques entre les deux populations diminue : 
P'i-Pe = (1-m)-(p;-p.) 
et la variation de la fréquence due à la migration est : 
Ap; = p'i-P;= M- (Pe-P;) 

L'équilibre est atteint lorsque p; = pe. Comme on pouvait s’y attendre, la 
migration tend à homogénéiser les fréquences alléliques entre les popula- 
tions qui échangent des gènes. Elle s'oppose ainsi à la différenciation qui 
tend à s'installer entre des populations isolées à partir d'un même stock ini- 
tial, par dérive, par mutation, et éventuellement par sélection si ces popula- 
tions sont soumises à des pressions sélectives différentes (milieux différents). 

Elle s'oppose aussi, en réintroduisant des allèles, à la perte de variabilité 
que la dérive provoque dans de petites populations. Il suffit pour cela d’un 
taux faible de migration. Nous avons vu qu’en l'absence de migration, la 
consanguinité dans une population finie panmictique augmentait à chaque 
génération selon la relation : 

fa = A/2N)j+(1- 1/2N)f, 1 


pour atteindre f = 1. Si à chaque génération un taux m de nouveaux immi- 
grants participe au pool de gamètes où sont tirés les gènes qui vont former 
la nouvelle génération, (pour garder un effectif constant, on suppose qu'ils 
remplacent des individus de la population initiale), la relation devient : 


fe = A/2N)+(1-1/2N)-(1-m)°.f 


{ou bien on tire deux copies du même gène avec une probabilité 1/2N, ou 
bien on tire des copies de deux gènes distincts de g — 1, qui peuvent être 
identiques avec une probabilité fg- 1 à condition qu'aucun des deux ne pro- 
vienne d’un nouveau migrant : probabilité (1 - m7; on suppose que les 
immigrants ne sont ni apparentés ni consanguins). 


On va arriver à une valeur d'équilibre fẹ qui ne change plus : 
fe = (1/2N)+(1-1/2N)-(1-m}.f, 
soit : 


1 
2N[1-(1-1/2N)(1-m)°] 
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Si m est faible, m? est négligeable devant m, et : 


fia 1 
e 1+4N-m-2m 


soit, puisque m est petit : 


N étant le nombre d'individus de la population, et m un taux d’immi- 
grants, Nm est le nombre de nouveaux immigrants qui par:icipent à la 
reproduction de la population à chaque génération. On voit donc qu'un nou- 
veau migrant s'établissant par génération suffit à limiter la consanguinité de 
la population à une valeur maximale de : fẹ = 1/5 = 0,2 au lieu de f, = 1 
sans migration. Chose remarquable, ce résultat est indépendant de la taille 
de la population : un immigrant par génération compte autant dans une 
population de dix individus que dans une de un million d'individus! La solu- 
tion de ce paradoxe est la suivante : évidemment, un immigrant dans une 
population d'un million « pèse » très peu, mais d’un autre côté, l’accroisse- 
ment de consanguinité dû à l'effectif fini est aussi très faible, de sorte que les 
deux choses se compensent. 


4.6.1 Remarque 


La notion de migration traduit la difficulté de définition d’une population. 
En effet, dans la plupart des cas, il est impossible de réaliser une partition 
satisfaisante de l'espèce en populations. C'est notamment le cas pour 
l'espèce humaine, mais également pour beaucoup d'animaux et de végé- 
taux. En fait, chaque individu a plus de chances de se reproduire avec un 
partenaire originaire d’un lieu géographiquement proche qu'avec un indi- 
vidu éloigné. En fait, le plus souvent, le généticien de terrain délimite la 
population qu'il étudie de façon arbitraire. Il peut ainsi choisir : 


e l'espèce humaine, 

e la population européenne, 

s la population française, 

e la population bretonne, 

e la population de Plougastel-Daoulas, 

e la famille Kervelec. 

Dans cette série de populations, le taux de migration varie de 0 pour la 


première (à notre connaissance) à un pourcentage élevé. Pour la simplicité 
des calculs, le premier ensemble peut donc apparaître plus satisfaisant que 
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les autres. Néanmoins, considérer l'espèce humaine comme une population 
unique est peu intéressant car : 


e l'environnement n'est pas homogène sur la surface du globe; 


a les gènes ne sont pas remis en commun sur l'ensemble de l'espèce à 
chaque génération (un gène porté par un Pygmée a très peu de chances de 
se retrouver chez un esquimau à la génération suivante); ceci se traduit en 
disant qu'il y a une certaine endogamie; 


a en conséquence de ces deux premiers points, les fréquences géniques 
sont variables d'un endroit à l’autre. En fait, des études récentes ont montré 
que ces fréquences varient continäment dans l'espace. Deux populations 
voisines ont des fréquences proches. Ce n'est qu'en choisissant délibéré- 
ment des groupes éloignés qu'on peut avoir l'impression qu’une disconti- 
nuité existe dans l'espèce humaine. Ce genre de résultat a amené certains 
biologistes à proposer l'idée que les races humaines n'existent pas. 


Dans l'idéal, le généticien devra donc, pour chaque cas, définir une popu- 
lation qui minimisera le taux de migration tout en gardant une certaine 
homogénéité. En fait, les choses ne se passent pas toujours ainsi dans la pra- 
tique, ne serait-ce que parce que l’on ne dispose pas des informations néces- 
saires. À moins de délimitation évidente (cas d'une petite population isolée), 
la « population » étudiée sera le plus souvent ce qui peut être échantillonné 
dans un temps raisonnable. Ce faisant, on risque notamment d'avoir une 
unité plus petite ou plus grande que celle pour laquelle il y a une remise en 
commun des gènes à chaque génération. Cela a diverses conséquences, 
dont la plus notable est l'effet Wahlund (encadré 5). 
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ENCADRÉ 5 : L'EFFET WAHLUND 
ET LA STRUCTURATION SPATIALE DES POPULATIONS 


L'effet Wahlund 


Soit un ensemble de k populations où les fréquences d'un allèle A sont respectivement 
Pie Par es D... Pg La fréquence moyenne de A sur l'ensemble est : 


P= E(p) = Ep; (n/N) 
où nest la taille de la i”? population, et N l'effectif total. La variance s'écrit : 
Vp) = Ep; P$ - (n/N) 
Si chaque sous-population a la structure de Hardy-Weinberg : 
AA : D; = pi Aa: H; = 2p;g; aa: R; = q 


La structure génotypique observée sur l'ensemble correspond aux fréquences génoty- 
piques moyennes : 


AA: D, =E) (n/N) = Ep) 
Aa: Hy = E(2p;,q) (N/N) = 2E(pq) 
aa: R = EC) - (n/N) Ş Eg’) 


D'un autre côté, si l'ensemble avait été une seule grande unité panmictique, on aurait 
attendu : 


AA: -© D, =P = [EP] 
Aa: He = 2PQ = 2- E(p): [1 - E(p)} 
aa: R= È = [1-E(p)]? 


Or la variance est V(p) = Etp)-[Etp)] et, puisque q = 1-p,V(g) = V(p). 
Il est donc aisé de voir que les fréquences génotypiques observées diffèrent de celles qu'on 
attendrait si on avait affaire à une seule population panmictique : 


Structure observée 


AA : D, = Ep’) = p+ vp) 
Aa: H = 2E(pq) = 2PQ-2V(p) 
aa: R = Ed) = @+ vp) 


Les deux structures ne sont équivalentes que si toutes les sous-populations ont les 
mêmes fréquences alléliques (V(p) =0, c'est-à-dire tous les p; égaux à P), 
évidemment! Mais dès qu'il y a une certaine différenciation entre populations, V (p) est 
supérieur à 0, et le fait de considérer le tout comme un seul ensemble conduit à obser- 
ver un déficit d'hétérozygotes. 
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Cet effet est appelé effet Wahlund : lorsque l'on mélange des sous-populations pan- 
mictiques dont les fréquences alléliques sont différentes, on observe sur l'ensemble un 
déficit d'hétérozygotes par rapport à la structure de Hardy-Weinberg, bien que les 
sous-unités aient chacune la structure de Hardy-Weinberg. 


Dans la pratique, il n'est pas toujours aisé de déceler a priori si la population que l'on 
étudie peut ou non être considérée comme une seule unité panmictique; le généticien 
devra donc toujours songer à l'effet Wahlund comme explication éventuelle d'un déficit 
observé d'hétérozygotes : son échantillonnage peut avoir indus plusieurs sous- 
populations suffisamment isolées entre elles pour qu'une différenciation génétique ait 
pu s'établir (cas fréquent chez des plantes ou des animaux peu mobiles, lorsque l’on 
échantillonne sur une surface étendue), ou il comprend deux populations qui, pour une 
raison ou une autre, ne se croisent pas librement, ou encore il inclut plusieurs généra- 
tions de composition génétique différente... 


Le déficit d'hétérozygotes est mesuré par l'indice de fixation (voir § 3.4 remarque 4) : 


F- 1 o _ 2PQ-2Vp) _ vp) 
2PQ 2PQ PQ 


Il est d'autant plus fort que les populations sont plus différenciées. 


Structure spatiale des populations et « statistiques F » de Wright 


Dans une population, plusieurs causes d'écart à la structure de Hardy-Weinberg 
peuvent se superposer : la population peut être structurée spatialement, avec plusieurs 
sous-populations différenciées (effet Wahlund); de plus, chaque sous-population peut 
s'écarter de la structure de Hardy-Weinberg pour diverses causes (régime de reproduc- 
tion non panmictique, par exemple). Pour décrire de telles situations, S. Wright a défini 
le jeu de paramètres suivant : 

Fıs mesure l'écart à la structure de Hardy-Weinberg à l'intérieur des sous-popula- 
tions (/S pour « individu dans sous-population ») : dans la "€ sous-populations la 
proportion d'hétérozygotes est : 


H; = 2p;g; (1 Fs) 
Fsr mesure le déficit dû à la différenciation entre sous-populations (ST pour « sous- 
population dans total »): F, = V(p)/PQ 


F,r mesure l'écart global à la structure de Hardy-Weinberg dans l’ensemble (/7 pour 
« individu dans total »): #, = 2PQ-(1-F,r) 


Si toutes les sous-populations ont un même indice de fixation F,, la fréquence d'hété- 
rozygotes observée sur l'ensemble est : 


H = PLPA -FAN = (1- F9 Ep) 
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Comme E(2pq) = 2PQ-2V(p) = 2PQ- (1 -— Fsr) 
il s'ensuit : Hy = 2PQ-(1— Fi) - (1 — For) 
Donc : (1 -= Fr) pe C- Fis) (1 — Fsr) 


Cette formule permet donc de séparer ce qui, dans la structure génotypique, revient à 
la structure spatiale en sous-populations différenciées (F5), et ce qui revient aux effets 
internes propres aux sous-populations (F,). Ainsi, à partir des déficits d'hétérozygotes 
observés dans un ensemble de populations, on peut estimer Fs, Fsret Fyr, par exemple 
pour décrire la structuration de la variabilité (part intra- et part inter-populations). 


En fait, la formule est aussi valable pour n'importe quel découpage dans une popula- 
tion, aussi arbitraire soit-il. Une autre de ses utilisations peut être, par exemple, lorsque 
l'on a échantillonné uniformément dans une espèce répartie sur un grand territoire, de 
rechercher pour quelle taille maximale des sous-unités le F, s'annule, en essayant des 
découpages plus ou moins fins : cela correspondra à la taille maximale sur laquelle on 
peut considérer qu'il y a panmixie, ce qu'on appelle un voisinage, et ceci peut être 
relié aux distances moyennes de dispersion des gènes par génération. 

Le Fsrmesure, lui, le degré de différenciation génétique des sous-populations, et il peut 
notamment être relié aux taux de migration. Ainsi, si les sous-populations se différen- 
cient seulement par dérive, et que la migration s'oppose à cette différenciation, on 
montre que : 


1 


Fr = Tyänm 


où n est la taille des sous-populations, et m le taux de migration par génération (c'est 
la même formule que celle que nous avons démontrée pour le coefficient de consan- 
guinité). 

(Si les Fç, des sous-populations ne sont pas les mêmes d'une population à l'autre, les 
formules ci-dessus restent valables en prenant comme F la moyenne pondérée : 


Èra s(n N) 
ER 
Zpatn, M 


En fait, les choses se présentent rarement ainsi dans la pratique : on ignore générale- 
ment les tailles relatives des sous-unités et on les suppose égales.) 


Introduction aux modèles 
à plusieurs locus : 
le déséquilibre de liaison 


5.1 LA NOTION DE DÉSÉQUILIBRE DE LIAISON 


5.1.1 Signification 


Connaissant, dans une population, les fréquences génotypiques à un pre- 
mier locus (par exemple, fréquence de AA = x), et les fréquences génotypi- 
ques à un deuxième locus (par exemple, fréquence de BB = y), il est tentant 
de penser que la fréquence des individus de génotype AABB dans cette 
même population est x.y. Ce calcul suppose que les événements « l'individu 
est AA » et « l'individu est BB » sont indépendants. En fait, il peut très bien 
en être autrement. Ainsi, tel est le cas, chez l’homme, pour les gènes du 
groupe sanguin « rhésus » (Rh*/Rh°) et les gènes de la couleur de la peau : 
dans la population noire américaine, la fréquence de l’allèle Rh° au locus 
rhésus est d'environ 45 %, alors que ce même allèle a une fréquence très fai- 
ble dans la population blanche, de l'ordre de 3 %. Par conséquent, si l'on 
considérait la population américaine dans son ensemble, on se tromperait 
lourdement en supposant qu'il y a indépendance, au sens statistique du 
terme (comme l’on dit que deux événements sont indépendants), entre le 
génotype au locus rhésus et celui aux gènes de la couleur de la peau. Par 
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rapport à ce que prévoirait l'indépendance des événements, certaines con 
binaisons génotypiques sont « anormalement » fréquentes (ici Rh° ave 
gènes de peau sombre). Il est très important de réaliser que cela n’impliqu 
pas une liaison génétique entre les deux caractères considérés : linkag 
génétique et association non aléatoire de deux gènes dans un 
population sont deux notions entièrement distinctes (une populatio 
n'est pas une F2 mendélienne!). De façon plutôt trompeuse, l’associatio: 
non aléatoire est appelée déséquilibre de liaison. 

L'existence d’un déséquilibre de liaison signifie donc que les gènes di 
locus différents ne sont pas associés au hasard dans la population : certai 
nes combinaisons sont plus fréquentes, d’autres moins fréquentes, que ne k 
prévoirait une association aléatoire de ces différents gènes. 


5.1.2 Expression formalisée du déséquilibre 


Considérons deux locus : 


e le locus 1 avec deux allèles A et a, en fréquences respectives pA et qas 

e le locus 2 avec deux alièles B et b, en fréquences respectives pg et qp. 

Plutôt que de s'intéresser aux génotypes des individus diploïdes (il en 
existe trois pour chaque locus, donc neuf au total), il est plus simple de 
considérer ce qui se passe au niveau des gamètes; l'indépendance ou la non- 
indépendance statistique qui existe dans une génération résulte de celle qu’il 
y avait dans la population des gamètes qui lont formée. I y a seulement 
quatre combinaisons gamétiques possibles : AB, Ab, aB et ab. 


Considérons l’une d'elles, par exemple AB : 


e S'il y a association au hasard dans la population gamétique (indépen- 
dance statistique), c'est-à-dire pas de déséquilibre, on aura : 


fréquence du gamète AB : SAaB = Pa‘ PB 


s Şil n’y a pas indépendance statistique, c'est-à-dire s’il y a déséquilibre, 
la fréquence de ce gamète sera différente (supérieure ou inférieure). Elle 
peut toujours s'écrire : 


| gas = Pa Pg+ D | 


| = D = gan-Pa Po | 


avec D > 0 ou D <0 


En remplaçant p4 par gag + Sap €t Pg paf Gap + Gp, On peut écrire D de 
la façon suivante : 
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D = GaB Zab- ZAb' BaB 


Le paramètre D mesure le déséquilibre de liaison dans la population pour 
ces deux gènes : l'écart à l'association aléatoire. Il est lui-même appelé 
déséquilibre de liaison. 


La connaissance des fréquences alléliques et de ce paramètre D suffit pour 
calculer les fréquences des quatre types de gamètes dans la population : 


+ gamètes AB : gap = Pa Ps+ D 
ə gamètes Ab : les gamètes portant l’allèle A sont en fréquence pa, 
donc : gap+Gab = PA 
= Gap = Pa- San = Pa-PaPa- D = pags - D 
e gamètes aB : de même g,g+Gag = Ps, donc : 
SaB = daPB- D 


e gamètes ab : gap + Gag = da + Gab = adp + D 


ce que l'on peut résumer dans le tableau de contingence suivant (attention, 
ce n'est pas un tableau de croisement!). 


Locus 1 


Locus 2 


W Siau lieu de AB, on était parti d'un autre gamète pour définir D, sa valeur absolue 
calculée à partir de n'importe laquelle des quatre fréquences gamétiques serait bien sûr 
la même, mais son signe pourrait être inversé. Ce signe est affaire de convention et sans 
importance. 


w# D étant défini à partir des fréquences des gamètes, il est aussi appelé déséquilibre 
gamétique. 

# Le déséquilibre de liaison est maximal lorsque la connaissance de l'allèle présent à un 
locus permet de prédire à coup sûr l'alièle de l'autre locus, c'est-à-dire lorsque n'exis- 
tent que deux types de gamètes sur les quatre possibles (AB et ab, ou Ab et aB). 
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Dans ce cas, nécessairement : 


Pa= Ps=P Ja == 


et D = pq 
Ceci est maximal lorsque p=q= 1/2 
alors D = 1/4 


Le déséquilibre est donc compris entre — 1/4 et + 1/4 (selon que les deux gamètes exis- 
tants sont Ab et aB, ou AB et ab). 


5.2 ÉVOLUTION DU DÉSÉQUILIBRE DE LIAISON SOUS LES HYPOTHÈSES 
DE HARDY-WEINBERG 


On considère une population où existe un déséquilibre de liaison initial 
entre deux locus : D, à la génération gamétique 0. On suppose que toutes 
les hypothèses de Hardy-Weinberg sont satisfaites : panmixie et absence de 
toute pression évolutive (migration, mutation, sélection ou hasard). Les 
fréquences alléliques vont donc rester constantes. Mais qu’en sera-t-il du 
déséquilibre. de liaison? ROSE 

Considérons l’un quelconque des gamètes, AB par exemple, à la nième 
génération gamétique. Il est en fréquence g4p,. Un tel gamète AB peut avoir 
êté formé de deux façons différentes (système complet d'événements) : 


e soit c’est un gamète parental, c’est-à-dire produit sans recombinaison 
entre les deux locus à la méiose. Ce gamète existait donc sous la même 
forme à la génération gamétique (n — 1). Si r est le taux de recombinaison 
entre les deux locus, la probabilité d'obtenir un gamète parental est (1 — r) 
et, sachant qu'il est parental, il est AB avec une probabilité gap,_1 : 


Génération gamétique (n-1) zygote Génération gamétique (n} 
A B AB 
gamèle AB 1 I 1 + 
(probabilité gABn-1} panmikiė pas de recombinaison gamètes 
: entre les deux loci parentaux 
gamète a 7 {probabilité 1-r) 1 
quelconque 


e soit c'est un gamète produit par recombinaison (probabilité r). La 
recombinaison produit un gamète AB à condition qu'elle se fasse entre un 
gamète portant l'allèle A (probabilité p4) et un gamète portant l’allèle B 
(probabilité pp). Puisque les gamètes s'unissent au hasard (panmixie), la pro- 
babilité d'avoir un gamète AB produit par recombinaison est r- ppg. 
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Génération gamétique (n-1} zygote Génération gamétique (n) 


A A B 
gamète portant À _L_L_ A 


+ x 
{probabilité p4) ~% al recombinaison gamètes 
3 eS recombinés 
all. 


TE B eaen 
(probabilité pp) 
Au total, la fréquence des gamètes AB à la génération n est donc : 
gagn = (1-r)-GaBn-1 +": PAPB 
Pour résoudre cette récurrence, on peut écrire : 
gagn = (1-r)-GaBn-1 (1 -T)PAPB + PAPB 
(SABn — PaPs) = (1-r):(Gapn-1-PAPB) 


D, = (1-r)-D, 1 


D, = @-r)D 


r est compris entre O {liaison absolue entre les deux locus) et > (indépen- 
dance génétique). 


e sir = Q, la fréquence des gamètes AB ne varie pas d'une génération à 
l'autre et D est constant; tout se passe comme si on avait un seul locus AB 
à quatre allèles; 

e si r est différent de O, ce qui est le cas général, (1 -— r) est strictement 
inférieur à 1: D ne cesse de diminuer au fil des générations jusqu’à l'équili- 
bre qui est : 


D = 0 & gas = PAaPg 


Ceci justifie l'appellation « déséquilibre » pour ce paramètre : pApg étant la 
fréquence d'équilibre des gamètes AB, D mesure bien un écart à l'équilibre. 

Il diminue d’autant plus vite que les gènes sont génétiquement distants 
(r grand). En particulier, pour des locus génétiquement indépendants 
(r = 5h le déséquilibre de liaison diminue de moitié à chaque génération et 
devient rapidement négligeable. 

Néanmoins, cette diminution est toujours progressive. Par conséquent, les 
fréquences des quatre gamètes évoluent progressivement, de même que celles 
des génotypes produits par leur union en panmixie, qui se déduisent facile- 
ment des fréquences gamétiques. Donc, si on part d’une situation où D z 0, 
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l'équilibre des fréquences génotypiques est acquis progressivement, même en 
panmixie, quand on considère la structure génotypique à plusieurs locus à la 
fois, alors que, curieusement, pour chaque locus pris séparément, on atteint 
la structure de Hardy-Weinberg dès la première génération de panmixie. 


5.3 CAUSES POSSIBLES D'UN DÉSÉQUILIBRE DE LIAISON 


Puisque les déséquilibres tendent à disparaître, pourquoi en observe-t-on 
dans les populations? 


a) Des pressions évolutives peuvent en engendrer : 


e Si la population est constituée par un mélange récent de deux popula- 
tions (ou plus) qui avaient des compositions génétiques différentes, on 
observera des déséquilibres, qui ne pourront disparaître que progressive- 
ment. Un cas évident est celui d'un mélange entre une population 
n'ayant que les allèles À et B avec une autre n'ayant que les allèles a et 
b; mais, en fait, de simples différences de fréquences alléliques entre les 
populations mélangées suffisent à engendrer un déséquilibre. L'arrivée 
continue de migrants venant d’une population de constitution génétique 
différente entretiendra de même un tel déséquilibre. Le mélange de 
populations est probablement la cause la plus fréquente des déséquilibres 
de liaison que l'on observe dans les populations humaines, comme celui 
du couple rhésus-couleur de la peau que nous avons évoqué. 


e Certains types de sélection peuvent aussi produire des déséquilibres : 
on conçoit, intuitivement, que ce puisse être le cas si les combinaisons 
AB et ab sont sélectivement meilleures que les combinaisons Ab et aB, 
par exemple (les conditions précises pour que la sélection engendre un 
déséquilibre sont en fait assez restrictives et complexes à exprimer). Une 
autre situation où la sélection peut induire un déséquilibre est la suivante : 
une nouvelle mutation (appelons-la A*) apparaît à un site chez un individu 
qui portait un allèle (appelons-le b;) à un locus situé au voisinage du site 
muté. Si cette nouvelle mutation est favorable, elle se répand dans la 
population, entraînant avec elle l’allèle b qui augmente aussi en 
fréquence. Cet effet est appelé auto-stop génétique : le gène b; 
« profite » de sa forte liaison avec le gène sélectionné. Cela engendre 
donc, au moins transitoirement, un excès de combinaisons A‘b,, donc un 
déséquilibre gamétique, pourvu que la recombinaison qui pourrait réasso- 
cier A* avec un autre allèle du locus b soit assez rare. Ce phénomène est 
appelé effet Hill-Robertson. 

Le simple hasard dans une population finie produit aussi des 
déséquilibres : le tirage des gamètes qui vont former une génération 
contient par hasard un excès de combinaisons AB et ab, par exemple. 
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b) Quelles que soient les causes à l’origine d’un déséquilibre de liaison, 
celui-ci se maintiendra d'autant plus facilement et longtemps qu'il y aura 
moins de recombinaisons entre les locus impliqués. Par conséquent : 


e Dans les populations, on observe plus souvent des déséquilibres entre 
des marqueurs très liés qu'entre des marqueurs génétiquement indépen- 
dants; ainsi, maintenant qu’on séquence l'ADN, on trouve beaucoup de 
cas de déséquilibres entre des sites séparés seulement par quelques cen- 
taines de paire de base, alors que les déséquilibres de liaison étaient 
considérés comme rares dans les mêmes espèces lorsqu'on n'avait que 
les marqueurs classiques. 

+ On observe plus souvent des déséquilibres (même entre marqueurs 
indépendants) chez des espèces à reproduction asexuée et chez des 
espèces autogames (où la recombinaison existe mais rompt rarement les 
associations puisqu'elle se fait généralement chez des homozygotes): 
c'est une des caractéristiques de la structure des populations autogames 
que les déséquilibres y sont très fréquents, alors qu'il est rare d’en trouver 
chez les allogames autrement qu'à l'échelle moléculaire. Dans le même 
ordre d'idées, et pour reprendre l'exemple rhésus-couleur de la peau, il 
est clair que l’'homogamie pour la couleur de la peau aux États-Unis doit 
ralentir l'effacement du déséquilibre. 


Exercices du chapitre A 


1 Structure génétique des populations 


Exercice A.1.1 


Généralement, il n’est pas possible de calculer les fréquences génotypi- 
ques à partir des seules fréquences alléliques, à moins de faire des hypothè- 
ses supplémentaires (en supposant la panmixie par exemple). Cela est 
néanmoins possible lorsque l’un des génotypes manque. 

Exprimer les fréquences des deux génotypes en présence en fonction des 
fréquences alléliques p (allèle A) et q (allèle a) dans les cas suivants : 


1) Génotypes AA Aa aa 
Fréquences 0 
2) Génotypes AA Aa aa 
| Fréquences 0 
3) Génotypes AA Aa aa 
Fréquences 0 


Exercice A.1.2 


Une étude de la diversité génétique d’une population de Hêtres (Fagus 
sylvatica L.) d'une forêt de Basse-Saxe, en Allemagne, a fourni les résultats 
suivants, pour deux locus enzymatiques : 


e Locus de la 6-phosphogluconate déshydrogénase (6-PGDH, 2 allèles, 
A, et Ao) 


Génotypes Aâ; Ajo AA 
Effectifs observés 125 31 4 

e Locus de la leucine aminopeptidase (LAP, 3 allèles, B4, B3 et Ba) 
Génotypes BıBı BiBs BB BB; BB} BB; 
Effectifs observés 121 0 2 28 8 1 


Calculer les fréquences alléliques à ces deux locus. 
(Référence : Gregorius et al., 1986, Heredity 57, pp. 255-262.) 


Exercice A.1.3 


Chez les chats tigrés, l'un des gènes déterminant la couleur du pelage est 
situé sur le chromosome X, il s’agit du gène appelé « orange ». Il comprend 
un allèle O donnant une couleur rousse et un allèle « gris » o. Les femelles 
possèdent une paire de chromosomes X, les mâles un chromosome X et un 
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chromosome Y. Dans une population, on observe M mâles parmi lesquels 
M, sont roux et M, sont « non roux ». Parmi les F femelles, F, sont rousses, 
F,, sont « non rousses » et F, ont un pelage « écailles de tortue », mosaïque 
de gris et de roux. . 

1) Pourquoi n'observe-t-on pas de mâles ayant un pelage « écailles de 
tortue »? 

2) Calculer la fréquence des allèles roux parmi les chromosomes X des 
femelles d'une part (f(O), des mâles d'autre part (f,,(0)), ainsi que dans la 
population totale (f(O)). 


2 Étude théorique d'un cas idéal 


Exercice A.2.1 


Dans une grande population panmictique, deux types de plantes sont 
observés. Certaines ont des fleurs blanches, d'autre des fleurs rouges. En 
effectuant des croisements et des autofécondations dans la population, les 
résultats suivants ont été obtenus : i 


e tous les descendants issus des plantes à fleurs blanches, autofécondées 
ou croisées entre elles, présentaient des fleurs blanches, 


e les descendants d’un premier type de plantes à fleurs rouges, autofé- 
condées ou croisées avec m'importe quelle autre plante, possédaient des 
fleurs rouges, 

e un deuxième type de plantes à fleurs rouges, autofécondées, donnait envi- 

ron trois descendants à fleurs rouges pour un descendant à fleurs blanches. 


1) Quel serait le résultat du croisement du deuxième type de plantes à 
fleurs rouges 


a) Avec une plante à fleurs blanches? 
b) Avec une plante à fleurs rouges? 


2) En échantilonnant au hasard 400 plantes dans la population, 
335 plantes à fleurs rouges et 65 plantes à fleurs blanches ont été récoltées. 
À partir de cet échantillon, estimer les fréquences alléliques au locus consi- 
déré dans la population. En déduire le nombre attendu de plantes hétéro- 
zygotes dans l'échantillon. 


3) Les descendants d'une plante à fleurs blanches, fécondée librement 
dans la population, sont récoltés. En tenant compte des résultats de la ques- 
tion précédente, quelles proportions des différents génotypes sont attendues 
parmi ces descendants? Quelles seront les proportions des différents 
phénotypes? Mêmes questions si la récolte se fait, dans les mêmes condi- 
tions, sur une plante à fleurs rouges du deuxième type. 


Exercice A.2.2 


Des daphnies (Daphnia cucullata) collectées dans un lac du Vermont, 
aux Etats-Unis, ont été étudiées pour leur génotype au locus d'une enzyme, 
la phosphoglucomutase. Deux allèles A} et A; ont été détectés et les géno- 
types se répartissaient de la façon suivante : 

Génotypes AA . AjÂ A2ÂÀ2 

Effectifs observés 38 91 62 
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La structure génétique d’une population de coléoptères troglodytes 
(Speonomus zophosinus) du Cloutet, dans les Pyrénées, a été étudiée pour 
le locus de la leucine aminopeptidase. Deux allèles (B4 et B2) étaient pré- 
sents et la population était structurée de la façon suivante : 


Génotypes B-B; B:B2 BB; 
Effectifs observés 112 34 28 


Dans ces deux exemples, tester si l'hypothèse d’un régime de reproduc- 
tion panmictique est acceptable. 


(Références : Mort et Wolf 1985, Heredity 55, pp. 27-36, Crouau-Roy 
1988, Heredity 60, pp. 321-327.) 


Exercice A.2.3 


Soit, dans une population, un locus à deux allèles, lallèle À étant domi- 
nant sur l’allèle a. Parmi 100 individus, on observe 64 individus de phéno- 
type [A] et 36 de phénotype [a]. Quelles sont les fréquences alléliques ? 
Quelle hypothèse faites-vous pour réaliser le calcul? Montrer que l’on ne 
peut pas tester cette hypothèse avec les données fournies. 


Exercice A.2.4 


Chez les chats, un locus à trois allèles T°, T et t’, est lié à l'aspect des rayu- 
res du pelage. L’allèle T* est responsable du phénotype abyssin qui est carac- 
térisé par un pelage de couleur homogène, sans rayures. L'allèle T conduit au 
phénotype tigré, caractérisé par deux traits dorsaux et des marques rondes sur 
les flancs. La tête, la queue et les pattes sont rayées. L'allèle t? est responsable 
du phénotype marbré, distingué du précédent par ses flancs tachetés. L’allèle 
T° est dominant sur l’allèle T lui-même dominant sur l’allèle t?. Dans une 
population, les fréquences de ces trois allèles sont p, q et r respectivement. 
On peut considérer que la population se reproduit en panmixie. 


1) Quelles sont les fréquences attendues des différents génotypes? 
2) Quelles sont les fréquences attendues des différents phénotypes? 


La population comporte 12 chats marbrés, 123 chats tigrés et 87 chats 
abyssins. 


3) Calculer les fréquences alléliques. 


Exercice A.2.5 


La mucoviscidose est une maladie génétique due à un allèle muté du gène 
CFTR. Cet allèle, récessif, est à l’origine d’une diminution du transport des 
ions chlorure à travers la membrane des cellules des muqueuses. Le mucus 
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sécrété par ces cellules, déshudraté et visqueux, obture alors les voies aérien- 
nes et digestives. 


En Europe, un enfant est atteint sur 2 500 naissances. 


1) Évaluer la fréquence des individus porteurs d’un allèle muté à l’état 
hétérozygote. Quelles sont les hypothèses nécessaires pour faire ce calcul? 


2) Parmi les allèles mutés, quelle proportion se trouve chez des individus 
hétérozygotes et quelle proportion chez des individus atteints? 


Exercice A.2.6 


Chez la Drosophile, un locus déterminant la couleur de l'œil est porté par 
le chromosome X. Les femelles portent deux chromosomes X, les mâles 
portent un chromosome X et un chromosome Y. À ce locus, l’allèle w 
(white) donne une couleur blanche à l’œil et est récessif par rapport à l’allèle 
sauvage w*. 


._ Dans une cage à population, on introduit un nombre égal de mâles de 
race w et de femelles de race pure w*. La population se reproduit en pan- 
mixie. On admet qu'il n’y a ni mutation, ni sélection et que la population est 
infiniment grande. 


1) Parmi les chromosomes X, calculer la fréquence de l’allèle w* chez les 
femelles (p) chez les mâles (p,,) et dans la population totale (p) pour la géné- 
ration fondatrice Gy, et pour les générations G} et G». Il y a un nombre égal 
de mâles et de femelles à chaque génération. 


2) Calculer p(n), pÂn) et pin) à la génération n en fonction de 
Pm(n-1), p{n-1)et p(n-1), ainsi que l'écart E, = p{n)-p,(n)en 
fonction de E, _:. 

3) En déduire les fréquences py, Pm et p à l'équilibre. 


Exercice A.2.7 


Le daltonisme est un dysfonctionnement de la vision des couleurs dû à un 
gène porté par le chromosome X. Un allèle récessif est responsable de cette 
anomalie. Waaler, en 1927, étudie la fréquence du daltonisme parmi une 
population d'enfants de Norvège. Parmi 9049 garçons, 725 sont dalto- 
niens et 8 324 ne le sont pas. 

1) Quelle est la fréquence q de l’allèle récessif dans cette population? En 
déduire la fréquence attendue de filles daltoniennes dans la population. 

2) Sur les 9 072 filles de son échantillon, Waaler dénombre 40 dalto- 
niennes. Cette observation est-elle cohérente avec les résultats de la ques- 
tion précédente? Comment expliquer la différence? 


3 Influence du régime de reproduction 


Exercice A.3.1 


1) Démontrer que, pour une population ayant une structure génotypique 
quelconque : 

Génotype AA Aa aa 

Fréquences D H R 

La statistique du c? calculée dans un test de conformité à la structure de 
Hardy-Weinberg peut s’écrire : 
BH 
2pq 

2) En déduire la taille de l'échantillon nécessaire pour déceler, par l'exa- 
men de la structure génotypique en un locus biallélique, l'existence d’une 
consanguinité avec F = 0,1 (c'est-à-dire pour que le test soit significatif au 
seuil 5 %). 


x? = F°N où N est la taille de l'échantillon et F = 1- 


Exercice A.3.2 


Une population est analysée à un locus particulier. Elle présente la com- 
position suivante : 

Génotypes AA Aa aa 

Fréquences Do Ho Ro 

Cette population est d'effectif illimité et ne fait l’objet d'aucune pression 
évolutive. Comment évoluent les fréquences alléliques d’une part, les 
fréquences génotypiques d'autre part si le régime de reproduction de cette 
population est : 

e la panmixie, 

e l'autogamie, 

e un régime mixte : chaque individu est autogame, sauf pour une propor- 
tion t de ses gamètes, qui se reproduisent en panmixie. 


Dans le dernier cas, exprimer H,, fréquence des hétérozygotes à la géné- 
ration n en fonction de H,,_; et chercher la fréquence d'équilibre H.. Quelle 
est, à l'équilibre, la valeur de l'indice de fixation F? 


Exercice A.3.3 


Dans une population de plantes hermaphrodites existent, à un locus, 
deux allèles À et a de fréquences (1 — q) et q. Pour chaque plante, une 
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proportion s des fécondations se fait en autogamie. Le reste a lieu en allo- 
gamie et il y a alors panmixie pour le couple À, a. 

La population comporte des individus de phénotypes [A] et [a]. Des grai- 
nes sont récoltées séparément sur des individus (fécondés librement) des 
deux phénotypes et sont semées : 


e certains individus de phénotype [A] n'ont que des descendants de phé- 
notype [A], 

e d’autres individus de phénotype [A] donnent une proportion (1 - x) d'indi- 
vidus de phénotype [A] et une proportion (x) d'individus de phénotype [a], 

e les individus de phénotype [a] donnent une proportion (1 — y) d'indivi- 
dus de phénotype [A] et une proportion (y) d'individus de phénotype [a]. 


Évaluer q et s en fonction de x et de y. 


Exercice A.3.4 


Chez certaines plantes, comme par exemple le trèfle, existe un locus par- 
ticulier, le locus S, responsable de ce que l’on appelle auto-incompatibilité. 
Un grain de pollen possédant un allèle donné ne pourra pas féconder une 
plante possédant le même allèle. 


1) Quelle est l'influence de ce système sur le régime de reproduction? 
Quelle est la proportion d'hétérozygotes au locus S? Que penser de cette 
proportion aux autres locus? 

2) Quel est le nombre minimum d’allèles qui peuvent coexister à ce locus 
dans une population? Calculer l’évolution des fréquences génotypiques 
d'une génération à l’autre dans ce cas. Quelles seront les valeurs de ces 
fréquences à l'équilibre ? 

3) Dans cette population, à l'équilibre, un nouvel allèle apparaît par 
mutation. Que va-t-il devenir? Que peut-on en déduire sur le nombre d’allè- 
les que peut posséder une population au locus S? 


Exercice A.3.5 


Chez une espèce végétale allogame annuelle coexistent deux types 
d'individus dont les dates de floraison diffèrent, appelés type (1) et (2). En 
dehors de cette particularité, ces individus sont identiques. L'espèce peut 
pousser dans deux milieux, au soleil ou à l'ombre, ce qui a une influence sur 
sa date de floraison. Les dates de floraison observées, en fonction du type 
de plante et du milieu, sont données dans la partie I du tableau. 


Une plante de type (1) a été croisée avec une plante de type (2) l’année 0. 
Les graines issues de ce croisement ont été semées l’année suivante dans 
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chacun des milieux et présentaient les caractéristiques données dans 1 
partie 11 du tableau. 

Les plantes obtenues se sont croisées librement, chaque milieu consti 
tuant une population totalement isolée, et ont produit la génération F2 
Dans cette génération a été dénombré, sur un total de 4000 plantes, k 
nombre de plantes fleurissant à chaque date (partie III du tableau). 


Milieu Soleil Ombre 
(1) 1 juin 15 juin 
Type de plantes : 
(2) 15 juin 30 juin 
Croi tF1:(1)x (2 
RUE 1% juin 15 juin 
Année 0 
Génération F2 1% juin : 3000 15 juin : 3000 
Année 1 (4000 plantes) 15 juin : 1000 30 juin : 1000 


Les générations suivantes seront constituées par le semis des graines 
dans le milieu où se trouvait leur mère. 


1) Quel pourrait être le déterminisme génétique de la date de floraison 
dans cette espèce? 

2) Quels sont les effectifs attendus des différents génotypes aux différen- 
tes dates de floraison parmi les plantes observées l’année 1 dans les deux 
milieux ? 

3) Les fréquences génotypiques vont-elles être modifiées? Pour quelle 
raison? Qu'en est-il des fréquences alléliques ? 

4) Dans la population située au soleil : 

e quelles sont les fréquences alléliques (p, et q; = 1 - p;) dans le pollen 
le 1% juin de l’année 1? 

+ quelles sont, en fonction de p4 et q4, les fréquences des différents géno- 
types dans les graines des plantes fleurissant le 1% juin de l’année 1? 

+ quelles seront, en fonction de p; et q4, les fréquences alléliques p» et q2 
parmi les plantes fleurissant au 1% juin de l’année 2? 

e calculer q, en fonction de q; en utilisant la suite des inverses 1/a,. 
Comment va évoluer la population? Quelles seraient, à l'équilibre, les fré- 
quences des plantes fleurissant aux différentes dates? 


5) Que va-t-il se passer dans la population se trouvant à l’ombre? 


6) Que se passerait-il si les deux populations, au lieu d’être isolées, 
étaient proches et pouvaient librement échanger du pollen? (montrer que si 
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les flux polliniques sont symétriques entre les populations, les flux alléliques 
ne le sont pas et en déduire que les allèles peuvent être piégés). Quel serait 
l’état d'équilibre des dates de floraison dans les deux milieux? 


Exercice A.3.6 


Quel est le coefficient d'apparentement entre deux demi-frères/sœurs 
(individus A et B)? 

Quel est le coefficient de consanguinité d’un individu issu du croisement 
entre : 

e un frère et une sœur (individu C), 

e deux cousins germains (individu D), 


e un oncle et une nièce (individu E)? 


Exercice A.3.7 
Quel est le coefficient de consanguinité de l'individu K, issu de deux géné- 
rations successives d’autofécondation, son ancêtre | étant non consanguin? 


Quel serait le coefficient de consanguinité d’un individu issu de n généra- 
tions d’autofécondation ? 


64 Précis de génétique des populations 


Exercice A.3.8 


Dans les populations d'abeilles domestiques, à chaque génération, seule 
une femelle est fertile, la reine. Dans une population isolée, la reine est fécon- 
dée par un certain nombre de ses frères. Ses ovules, s'ils sont fécondés, don- 
nent des femelles diploïdes. Les mâles, haploïdes, proviennent d'ovules non 
fécondés. La généalogie de trois générations de reines est la suivante : 


Génération (n-2) 


[O 
p< ( (D reine (ipase) 


[1] Génération {n-1} 
va ( [1] reine Pape) 
(D Génération {n} 


À l'aide de ce schéma, exprimer f,, coefficient de consanguinité de la 
reine de la génération n, en fonction de f, _; et f, _», coefficients de con- 
sanguinité des reines des deux générations précédentes. 


Exercice A.3.9 


Dans la mythologie grecque existe une famille célèbre dont voici une 
généalogie simplifiée. À partir de ce schéma, calculer le coefficient de 
consanguinité d'Antigone ainsi que son coefficient de parenté avec son 
oncle Créon. On supposera qu’en dehors des informations de la figure, il 
n'existe aucune autre relation de parenté entre les individus. 


Laios Jocaste Créon 
ES 


4 Influence des pressions évolutives 


Exercice A.4.1 


Soit deux plantes hétérozygotes à un locus, de génotype Aa. Pour cons- 
tituer la génération suivante, les deux plantes se croisent librement et deux 
graines sont prélevées au hasard pour obtenir deux plantes. 


Quelles sont les probabilités de trouver, dans cette deuxième génération, 
0, 1, 2, 3 ou 4 copies de l'allèle A? Quelle est alors la probabilité d'avoir 
conservé le polymorphisme ? 


Exercice A.4.2 


Chez une espèce bactérienne, un gène code pour une enzyme permet- 
tant la transformation de l'indole en tryptophane. L'allèle A produit une 
enzyme active, mais les bactéries portant l’allèle a, inactif, ont besoin de 
tryptophane dans le milieu de culture pour se développer. 


1) Une culture mixte de cette espèce est constituée à partir d'une seule 
bactérie de chaque type (A et a), dans un milieu contenant du tryptophane 
en quantité légèrement limitante. Dans ces conditions, les bactéries de type 
a se divisent un peu plus lentement que celles du type À : une division toutes 
les 30 minutes en moyenne pour les bactéries de type À, toutes les 
31 minutes pour les bactéries de type a. 


Combien de temps faudra-t-il pour que la proportion de bactéries de type 
a ne représente plus que 1/1 000 du total? 


2) Une. culture mixte est constituée de la même façon dans un milieu 
contenant du tryptophane en quantité largement excédentaire par rapport 
aux besoins des bactéries. Les bactéries de type A et a poussent alors à la 
même vitesse (une division toutes les 30 minutes en moyenne). Si l’allèle A 
mute en a avec une probabilité égale à 10° 6 à chaque division, combien de 
temps faudra-t-il pour que la proportion de bactéries de type A soit réduite 
à 1/1 000 du total? 


3) En fait, la culture est réalisée dans des flacons de 100 ml, et la crois- 
sance s'arrête quand les bactéries ont atteint une densité de 10$ cellules par 
ml (phase stationnaire). Au départ, on utilise un nombre égal de bactéries de 
chaque type. Quand la phase stationnaire est atteinte, on repique un échan- 
tillon de la culture dans un milieu neuf de même composition, et on recom- 
mence indéfiniment. Comment la constitution de la culture va-t-elle évoluer : 


a) s’il n'y a pas de mutation? 


b) s’il y a mutation de A en avec une fréquence de 1075, sans mutation 
de a en A? 
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Exercice A.4.3 


Soit une population comportant neuf individus haploïdes. À chaque 
génération, chaque descendant a pour unique parent un individu tiré au 
hasard parmi les neuf individus de la génération précédente. La taille de la 
population est constante. L'évolution de cette population peut être simulée 
en utilisant une table de nombres tirés au hasard. Le tableau comprend, dans 
chaque colonne, neuf chiffres tirés aléatoirement de 1 à 9. On choisit de 
représenter chaque génération par une colonne de ce tableau, elle indique 
alors quel individu a laissé un descendant à la génération suivante. (Si un 
individu est cité deux fois, c'est qu'il a laissé deux descendants; s’il est cité n 
fois, c'est qu'il en a laissé n.) Ainsi, la génération engendrée par la première 
colonne est constituée d'un descendant des individus 1, 8 et 9 et de deux 
descendants des individus 2, 5 et 7. Cette situation peut être représentée de 
la façon suivante : 


8 9 


= | — -$ Première génération 


La deuxième génération peut être engendrée de la même façon à partir 
de la deuxième colonne du tableau (ou d’un autre) et ainsi de suite. 

1) En partant dune colonne quelconque du tableau, tracer l’évolution 
d'une population pendant une vingtaine de générations. 


Trouver l'ancêtre commun le plus récen{ de deux individus quelconques 


de la dernière génération. 


Quel peut être le devenir d’un allèle, Li à un individu de la population? 


Trouver l'ancêtre commun le plus récent des 9 individus de la dernière 
génération. 

2) Soit une population de N individus haploïdes. On va supposer main- 
tenant que chaque individu d’une génération est le descendant d'un des N 
parents de la génération précédente au hasard, chaque descendant étant tiré 
indépendamment des autres. Calculer la probabilité pour que deux individus 
. d'une même génération soient issus du même parent. Calculer la probabilité 
P(X = 2) pour que deux individus d’une même génération possèdent un 
ancêtre commun deux générations avant, trois générations puis g généra- 
tions auparavant (P(X = g)). Calculer l'espérance de cette probabilité : 


E(P(X)) = y kP(X =k) 
k=1 
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Tableau 1 : Nombres au hasard 


(ee) 


1 


No | 


~ 
w| | >|] alinj] uw I BR 
wv 


o 
|o 
LL 


E N3 


p> 


_ 


[e] 
f 


c'est-à-dire le nombre de générations qu’il faut remonter en moyenne pour 
trouver un ancêtre commun à deux individus quelconques d'une génération, 
dans une population d'individus haploïdes. 


On rappelle que : dE x" 


3) Écrire un programme en basic simulant ce processus. 
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Exercice A.4.4 


Un troupeau bovin laitier comprend 15 vaches et 2 taureaux. Quel es 
son effectif génétique ? 


Exercice A.4.5 


Soit une population d'individus haploïdes. À un locus donné, on observe 
deux allèles A et a dans la population. Les individus portant l’allèle A {res- 
pectivement l’allèle a) ont une valeur sélective w4 (respectivement wa). En 
l'absence de toute autre pression évolutive, si p est la fréquence de l'allèle À 
à une génération, exprimer la valeur de p’, fréquence de A à la génération 
suivante. En déduire l'expression de Ap = p’-p. Comment la population 
va-t-elle évoluer? Y a-t-il un équilibre polymorphe possible? 


Exercice A.4.6 


Dans une population de maïs, espèce allogame, existe un locus pour 
lequel les valeurs sélectives relatives sont les suivantes : 


Génotypes AA Aa aa 
Valeurs sélectives 3/4 1 0 


1) Donner en fonction de p, fréquence de lallèle À, les variations de 
cette fréquence à chaque génération. 


2) Existe-t-il un état d'équilibre polymorphe pq # 0 ? 


Exercice A.4.7 


Un aviculteur possède deux populations de poules, l'une est composée 
de poules blanches à pattes jaunes (souche A), l'autre est composée de 
poules rousses à pattes blanches (souche B). Ces deux souches sont desti- 
nées à produire en croisement (A x B) des poulets commercialisables. Dans 
un premier temps, l’aviculteur laisse, à l’intérieur de chaque population, les 
individus se reproduire entre eux. La souche A donne une descendance A’ 
d'individus à pattes jaunes, parmi eux 99 % ont des plumes de couleur blan- 
che et 1 % des plumes de couleur rousse. La descendance B’ de la souche B 
est constituée d'individus à plumes rousses parmi lesquels 97 % présentent 
des pattes blanches et 3 % des pattes jaunes. 

1) Quel est le déterminisme génétique de la couleur des pattes et du 
plumage? (On choisira la solution la plus simple, un seul locus pour chaque 
caractère.) 

2) Dans le produit du croisement C, quelle est la proportion s de poules 
répondant au standard (plumes et pattes blanches)? 
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On élimine dans la descendance A les individus à plumes rousses et dans 
la descendance B’ les individus à pattes jaunes. On réalise alors le croise- 
ment C = (A' x B’). 

3) Quelle sera dans ce cas la proportion s’ d'individus répondant au 
standard? Quel est le gain de l’aviculteur du fait de cette sélection? 


Exercice A.4.8 


L'anémie falciforme est une maladie génétique humaine liée à un allèle 
létal récessif. En Afrique, les individus hétérozygotes à ce locus sont proté- 
gés de la malaria. Leur valeur sélective vaut par conséquent 1,18, celle des 
homozygotes étant de 0,97. 

1) Ce locus est dans une situation d'équilibre en Afrique. Quelle est la 
fréquence q, de l'allèle récessif? Quelles sont les fréquences génotypiques ? 


2) En Amérique du Nord, la malaria est absente : les hétérozygotes ne 
sont plus favorisés, leur valeur sélective est égale à celle des homozygotes. 
Dans la population noire américaine, on observe 12 % d’hétérozygotes et 
88 % d’homozygotes. Exprimer l’évolution de la fréquence de l'allèle réces- 
sif d’une génération à l’autre (1/q, en fonction de 1/q, 1 puis de 1/40). En 
déduire le nombre de générations écoulées depuis l'arrivée de la population 
africaine en Amérique, liée à l'esclavage. 


Exercice A.4.9 


Dans une espèce végétale annuelle aux graines disséminées par le vent, 
on considère un locus à deux allèles A et a, non soumis à la sélection. Cette 
espèce se trouve sur deux îles voisines. Les fréquences alléliques sont diffé- 
rentes dans les deux îles. À la génération n, la population de l’île i contient 
une proportion m; d'individus issus de graines venues de l’autre île, et une 
proportion 1-m;, d'individus descendant des plantes déjà en place. La 
situation est parallèle dans l’île j. On suppose que la migration est indépen- 
dante du génotype au locus considéré, qu'il n'y a pas de mutation, et que 
les populations sont suffisamment grandes pour que la dérive puisse être 
négligée. 

1) Calculer les fréquences P, (n) et P; (n) de Fallèle À à la génération n en 
fonction des proportions m; m;et des fréquences P, (n - 1), P; (n — 1). 

2) En supposant que les taux de migration sont constants dans le temps, 
déterminer la situation d'équilibre. 

3) Soit E, l'écart entre les fréquences de l'allèle A dans les deux popula- 
tions à la génération n. Combien de générations seront nécessaires pour 
que cet écart soit réduit de moitié si m; = 1 % et m,= 2%? 
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lei lle j 


allèle : 


fréquence : 


Exercice A.4.10 


Le coquelicot est une espèce auto-incompatible. Un ensemble de plantes 
a été étudié à un locus présentant deux allèles, A, et A. Les effectifs sui- 
vants ont été observés : 

Génotype AA: AA AA 

Effectifs 80 80 40 

1) Calculer les fréquences alléliques. Cette population a-t-elle la structure 
de Hardy-Weinberg? 

La population étudiée résulte en fait du mélange de plantes prélevées en 
deux lieux distincts. En respectant l’origine des plantes, les effectifs suivants 
sont observés : 


Lieu 1 Lieu 2 
EE arme EE SEE 
Génotype AA A^) AA, AA: Aâ? A4 
Effectifs 62 33 5 18 47 35 


2) Qu'en est-il des structures génotypiques à ces deux endroits? Qu'en 
déduisez-vous sur la cause du déficit trouvé sur l’ensemble ? 


5 Introduction aux modèles à plusieurs locus : 
le déséquilibre de liaison 


Exercice A.5.1 


La composition d’un échantillon de gamètes d’une population est 
connue pour deux locus, l’un à trois allèles, A}, À: et A3 et l'autre à deux 
allèles B; et B}. Les gamètes se répartissent de la façon suivante : 


Las e } A A A; Total 
B, 25 9 18 52 

B, 3 39 6 48 

Total 28 48 24 100 


Combien de paramètres sont nécessaires pour décrire les déséquilibres 
gamétiques dans ce cas? Quelles sont leurs valeurs? 


Exercice A.5.2 


Les graines de deux lignées de maïs (plante allogame dont la reproduc- 
tion peut être considérée comme panmictique) sont mélangées en propor- 
tions p et q. Ces deux lignées diffèrent notamment pour deux locus 
bialléliques (A, a et B, b) : 

Lignée 1 : génotype AA BB 
Lignée 2 : génotype aa bb 

Ce mélange est semé au champ, il constitue la génération Go. Les grai- 
nes sont ressemées d’année en année, avec des effectifs assez grands pour 
que la dérive puisse être négligée. On suppose qu'aucune sélection ne 
s'exerce, que le champ est isolé et que le taux de mutation est négligeable. 


Quelle sera la composition de la population dans les générations Go, G1, G, : 


e au locus A/a? 
e au locus B/b? 


e aux deux locus simultanément? 


En déduire la valeur du déséquilibre gamétique dans ces générations. 

Application numérique : p =q = 1/2; r = 1/2 (les deux locus sont 
indépendants). 

Suivre l’évolution de la fréquence des génotypes aa bb et aa BB (calcul 
pour G4 à Gs, G. et graphe). 


Le cryptopolymorphisme 


Généralités 


Une des causes du maintien de la variabilité dans les populations est le 
fait que la mutation produit constamment des gènes nouveaux. Le plus sou- 
vent, cependant, le résultat des mutations est défavorable : la protéine pro- 
duite par le gène muté fonctionne moins bien, ou même le gène n'est plus 
du tout fonctionnel (cas d’une délétion ou d’une mutation « non-sens », par 
exemple). Si le gène muté apporte un désavantage sélectif aux individus qui 
le portent, la sélection tend à l'éliminer. Toutefois ce genre de mutation se 
produit sans cesse, réintroduisant ces gènes défavorables dans les popula- 
tions. Ce doit être un cas fréquent : la plupart des maladies génétiques chez 
les humains correspondent sans doute à une telle situation, et plus générale- 
ment toutes les mutations entraînant la perte de fonction des gènes. Tous les 
locus sont concernés : il ne doit guère y avoir de gènes dont la perte de fonc- 
tion ne soit plus ou moins défavorable. On peut penser que si de tels gènes 
existaient, ils cesseraient bientôt d’être fonctionnels en accumulant des 
mutations diverses ou en subissant des délétions. Tel est peut-être d’ailleurs 
le cas de certains « pseudogènes »; ce sont des séquences de l'ADN avant 
plus ou moins l’organisation et la séquence de gènes fonctionnels, dont ils 
seraient à l’origine des copies redondantes apparues par duplication, mais 
avec des anomalies diverses, telles que l'insertion de codons « stop », qui les 
rendent non fonctionnels. 


Si l’allèle muté a est récessif (ce qui est le cas le plus fréquent), les valeurs 
sélectives relatives que l’on peut attribuer aux trois génotypes sont : 


AA Aa aa 
wi=l w= 1 wz=1-s 
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s représentant le désavantage sélectif des individus aa qui expriment la 
mutation par rapport aux individus normaux (pour s = 0, il n'y a pas de 
désavantage; pour s = 1, a est létal). 
Dans une population panmictique, la pression de sélection a pour 
valeur : 
sq 
1- sq” 


AP = pq 


La pression de mutation est, quant à elle : 
AmP = -up 


avec u le taux de mutation de À en a par génération. 

Ap est positive : la sélection tend à faire augmenter la fréquence de 
l'allèle « normal » et à éliminer l’allèle muté. A„p est négative : la mutation 
fait diminuer la fréquence de A. On atteint un équilibre où la fréquence des 
gènes ne change pas d'une génération à l'autre lorsque les deux pressions 
s’équilibrent, c'est-à-dire : 


AP + Amp = 0 
| spq 
soit : = up 
1-sq° 
sq? 
=u 
1-sq° 
TES 2 u 
d'où : sq = rer 


Le taux de mutation u étant faible (de l’ordre de 107% ou 1076), il appa- 
raît que sq” doit être faible, ce qui veut dire que : 


s soit s est très faible, auquel cas : 
W; = W2 =~ W3 


Il n’y a donc pratiquement pas de sélection, et dans ce cas, nous avons 
eu tort de négliger le hasard, qui doit être la pression évolutive principale : il 
n'y a pas vraiment d'équilibre et la dérive va jouer (éventuellement en fixant 
l’allèle défavorable): 


e soit q est faible, auquel cas nous avons bien un équilibre entre l'effet 
de la mutation, qui tend à accroître la fréquence du gène défavorable, et 
celui de la sélection qui tend à l’éliminer, mais cet équilibre s'établit à une 
fréquence de a très faible; la coexistert® des deux allèles est un élément de 
variabilité peu important dans la population, presque tous les individus 
exprimant le phénotype « normal » [A]. 
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Cette situation est appelée cryptopolumorphisme; c'est celle qu'on 
observe pour la mucoviscidose, pour l'hémophilie, la galactosémie et, en 
général, pour presque toutes les maladies génétiques graves. 


Pour un gène autosomal récessif défavorable dans une population 
panmictique : 


e la fréquence des individus atteints aa est : 


e la fréquence de l’allèle défavorable est : 


Fréquence d'un gène létal 


Un gène létal est un gène qui confère aux individus qui l'expriment une 
valeur sélective nulle, soit qu'ils soient non viables, soit qu'ils soient stériles. 


2.1 GÈNE LÉTAL RÉCESSIF DANS UNE POPULATION PANMICTIQUE 


C'est le cas vu ci-dessus avec $ = 1; alors à l'équilibre : 


e la fréquence d'apparition à chaque génération des individus létaux aa 


est égale au taux de mutation : 


+ la fréquence de l’allèle défavorable dans la population est : 


ə la fréquence des porteurs du gène à l’état hétérozygote est : 
2pq=2q = 24/u 


Siu= 10%. elle est donc de l’ordre de 1 individu sur 500. 
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2.2 GÈNE LÉTAL RÉCESSIF DANS UNE POPULATION AUTOGAME 


Comme précédemment, nous allons rechercher l'influence de la sélec- 
tion seule, celle de la mutation seule, et calculer la fréquence pour laquelle 
elles s’équilibrent. 


La pression de sélection dépend de la fréquence d'apparition des indivi- 
dus atteints. Soit q la fréquence de l’allèle a dans la population de reproduc- 
teurs. La population qui se reproduit est composée de deux génotypes (les 
aa sont morts ou stériles) : 


AA Aa 
en fréquences (1 — 2q) 2q 
Lorsque ces individus se reproduisent en autogamie, ils produisent : 
Adultes : AA Aa 
(1-29) 2q 
ļ JL 
Zygotes : AA laa laa Tia 
; m a 


Les individus aa (en fréquence 1/4.2q = 1/2q) disparaissent. Parmi les 
adultes reproducteurs de la génération suivante (nous avons ainsi bouclé une 
génération, où la sélection a joué), la fréquence des hétérozygotes est donc : 


, _ 1/2.2q _ 2q 

kas 1-1/2q 2-q 
it. | 
soit : g = Zq 


La pression de sélection est : 


La pression de mutation est toujours : 
Amg = - up 
A l'équilibre : 
A,q+A,gq = 0 


soit -aü 


e La fréquence de l’allèle défavorable dans la population adulte est donc : 
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e La fréquence d'apparition à chaque génération des individus létaux aa 
est : 


Ici encore, elle est donc égale au taux de mutation. 


2.3 GÈNE LÉTAL RÉCESSIF DANS UNE POPULATION 
SE REPRODUISANT VÉGÉTATIVEMENT 


Dans la population qui se reproduit, 


soit x la proportion de génotypes AA, 

et {1 - x) la proportion de Aa. 
Ces individus se reproduisent identiques à eux-mêmes, à la mutation près : 
Adultes AA Aa 
Fréquences x (1- x) 

JL 4 

Descendance 
(propagules (1 -u) AA+ 2u(1 -u)Aa (1-u)Aa+u aa 
avant sélection) +u?aa 


Les individus létaux aa sont donc produits en fréquence : 
x.u? + (1-x).u 


Dans les adultes produits (après sélection qui élimine les aa), la propor- 
tion x’ de AA est donc : 


, x(1-u)ÿ 
LR 
1-xu"-(1-x)u 
, __X(1-u) 


l+ux 


(1-u)/(1+ux) est manifestement inférieur à 1, donc x’ est inférieur à 
x: la fréquence des AA ne cesse de décroître et tend vers 0. A l'équilibre, la 
population reproductrice est composée exclusivement de Aa, et la fré- 


quence du gène létal est : 
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Dans cette population à l'équilibre, la fréquence d'apparition du géno- 
ype aa est encore u, taux de mutation. 


# Ce calcul donne une idée de ce que devient la population; la fréquence q ne peut que 
croître. Mais l'équilibre (100 % d'hétérozygotes) est rarement atteint, vue l'extrême len- 
teur du phénomène. En effet, le terme (1 — u}/{1 + ux) est équivalent à 1 — {1 + x), et 
très peu différent de 1. Tout ce que nous avons dit sur la lenteur d'action de la mutation 
est vrai ici. 


?.3.1 Gène létal dominant 


Quel que soit le régime de reproduction, un gène létal dominant ne peut 
ovenir que d’une mutation récente. La fréquence du gène létal A est donc 
> =u, mais le phénotype létal Aa apparaît avec une fréquence 2u. La 
opulation est composée de : 


2u Aa et(l-2u)aa 


Conclusion 


Selon le régime de reproduction, la fréquence d'équilibre d'un gène 
récessif létal peut donc varier dans un intervalle très large (de 2u à 1/2), 
mais elle s'ajuste toujours de telle sorte qu'à l'équilibre, la fréquence d'appa- 
rition du phénotype létal est toujours égale à la fréquence de la mutation qui 
introduit le gène létal. En d'autres termes, à l'équilibre, la fréquence d’appa- 
rition d’une tare génétique dans la population ne dépend pas de la manière 
dont la population se reproduit. En particulier, et contrairement à une idée 
reçue, un régime consanguin, s'il est pratiqué depuis suffisamment long- 
temps pour que l'équilibre soit atteint, n'entraîne aucune augmentation de la 
fréquence d'apparition des tares. Ce qui est vrai, en revanche, c'est que 
l’arrivée d’un système de reproduction consanguin dans une population se 
reproduisant auparavant en panmixie démasque instanfanément un certain 
nombre de gènes récessifs délétères. C’est d’ailleurs un moyen de reconnaf- 
tre une espèce autogame d’une espèce allogame. En autofécondation, la 
première fournit des individus normaux, alors que la seconde fournit des 
individus tarés en grand nombre. 


L'indépendance entre le régime de reproduction et la fréquence d'appa- 
rition des individus exprimant le phénotype défavorable reste vraie pour un 
gène non létal, simplement défavorable : si la valeur sélective des individus 
exprimant le gène est (1 — s), la fréquence d'apparition des individus expri- 
mant le caractère est toujours à l'équilibre u/s lorsque le gène est récessif 
(ainsi que nous l'avons calculé pour une population panmictique), et environ 
Zu/s si le gène est dominant. 
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Cela peut être montré assez simplement, au moins dans le cas d’un gène 
récessif. Considérons une population au stade zygotes (ou propagules), 
avant sélection : 


Génotypes AA Aa aa 
Fréquences D H R 
Valeurs sélectives wj;=1 wo=l w3=1l-s 


La fréquence de l’allèle A à ce stade est : p = D + 5H ; 


Au stade adulte (après sélection, qui élimine une fraction s des aa), les 
fréquences génotypiques deviennent : 


D H (1 -s)R 
1-sR 1-sR 1-sR 


et la fréquence de À est : 
_D+1/2H. p 


Pad = TL SR  I-5R 


Lors de la reproduction, des mutations se produisent. La nouvelle fré- 
quence de À devient : 


; l-u). 
p’ = 1- poa = TRE 
L'équilibre est réalisé lorsque p^ = p, c’est-à-dire lorsque : 
1-sR = l-u 


Nous n'avons fait ici aucune hypothèse sur le régime de reproduction. Ce 
calcul a une valeur générale. 

Une valeur sélective de (1 — s} signifie qu'une proportion s des individus 
exprimant le caractère défavorable est éliminée par la sélection. Cela repré- 
sente donc une proportion de la population égale à : 


Cette proportion éliminée est appelée le fardeau de mutation (L pour 
load). Il représente la diminution de la valeur sélective moyenne de la popula- 
tion due aux mutations à ce locus. Cette valeur sélective moyenne est ici de : 


w = l-u 
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il s’agit ici d'une valeur sélective relative, 1 étant celle des meilleurs indivi- 
dus, ceux qui ne portent pas la mutation). 

Ce résultat remarquable, obtenu par Haldane, montre qu'à l'équilibre, la 
fraction de la population éliminée à cause des mutations délétères récessives 
en un locus est toujours u, quel que soit le régime de reproduction, et surtout 
quelle que soit l'importance de l'effet délétère de la mutation : un gène 
faiblement délétère (s faible) diminue autant la valeur sélective moyenne de 
la population, est à l’origine d'autant de « morts génétiques », qu'un gène 
létal (s = 1). En effet, si la proportion des individus aa éliminés est beaucoup 
plus faible dans le premier cas que dans le second, la fréquence à l'équilibre 
de ces individus dans la population est aussi beaucoup plus élevée, de sorte 
que les deux effets se compensent exactement. 


De même pour un gène dominant (même incomplètement) : 
L=2u 


indépendamment, ici encore, de l'importance de l'effet délétère et du 
régime de reproduction. 
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Exercice B.1 


La galactosémie est une maladie héréditaire. Elle s'explique par la pré- 
sence d'allèles récessifs (à différents gènes), responsables d’un déficit d’enzy- 
mes impliquées dans le métabolisme du galactose (sucre présent dans le lait). 
La dégradation hépatique du galactose est perturbée et il y a alors accumu- 
lation de métabolites toxiques du galactose. Les nourrissons galactosémi- 
ques ne survivaient pas autrefois. lls sont à présent sauvés par une 
suppression totale du galactose dans l’alimentation 


1) Quel(s) type(s) de descendant{s) peut donner un couple de galacto- 
sémiques ? 

2) Quelle était la fréquence des allèles responsables de la galactosémie à 
l'époque où cette maladie était incurable? (La fréquence de la mutation 
directe sera prise égale à 10- 6, la mutation reverse sera jugée négligeable. La 
population peut être considérée comme panmictique aux loci concernés.) 


3) Désormais, ce caractère est vraisemblablement indifférent à la sélec- 
tion. Quelle sera la fréquence d'équilibre des allèles inactifs? 


Exercice B.2 


La maladie de Tay-Sachs est une maladie génétique due à une déficience 
de l'hexosaminase A, une enzyme lysosomale qui dans les conditions nor- 
males catalyse l’hydrolyse du ganglioside GM2, un glucolipide abondant 
dans les membranes des neurones. Le nouveau-né est normal mais les pre- 
miers signes d’une dégénérescence progressive du tissu nerveux apparais- 
sent vers l’âge de 6 mois. Cette dégénérescence est fatale et les enfants 
atteints ne survivent que jusqu’à 4 ou 5 ans. Cette maladie affecte autant de 
filles que de garçons. 

1) En Europe occidentale, il naît environ un enfant atteint pour 250 000 
naissances. Évaluer la fréquence de l’allèle responsable de la maladie, en 
supposant qu'il est récessif par rapport à l’allèle normal puis en supposant 
qu'il est dominant. Quelles hypothèses supplémentaires faites-vous pour 
réaliéer les calculs? 

2) Évaluer le taux de mutation qui produit l’allèle déficient dans les deux 
hypothèses (récessivité ou dominance). 

3) Une étude a montré que parmi les enfants atteints, un grand nombre 
(15 environ) était né d'unions entre cousins germains, alors que la fréquence 
de ce type d'union n’était que de 5 pour 1000 dans la population globale. 


Cette observation vous renseigne-t-elle quant au caractère récessif ou 
dominant de l’allèle? 

Exprimer, en fonction de f, coefficient de consanguinité, et q, fréquence 
de l’allèle déficient, la probabilité pour un enfant issu de l'union entre deux 
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cousins germains d'être atteint. Calculer cette probabilité grâce aux probabi- 
lités conditionnelles et en déduire la valeur de q. 


Exercice B.3 


Soit un allèle récessif létal introduit par mutation dans une population 
panmictique. Sachant que le taux de mutation est égal à u : 


1) Quelle sera la fréquence de cet allèle à l'équilibre? Quelle est la pro- 
portion d'individus hétérozygotes à ce locus? 


2) En supposant qu'il existe dans le génome N locus de ce type soumis 
au même taux de mutation, quel sera le nombre moyen d'allèles létaux por- 
tés à l’état hétérozygote par individu? 

3) Quelle sera la valeur du fardeau génétique correspondant? (On négli- 
gera u devant 1 pour tous les calculs.) 


4) Sachant que (1-x)"=e"* quand x est très faible, et en prenant 
N = 10* et u = 105 calculer le nombre moyen d'allèles létaux portés par 
individu et calculer la valeur du fardeau. Chez l'Homme, le nombre moyen 
d'allèles récessifs létaux présents chez chaque individu est évalué à 4. Quel(s) 
écart(s) au modèle utilisé pour les calculs pourrai(en)t expliquer la différence 
entre les valeurs attendues et observées? 


Le polymorphisme 


Introduction 


Nous avons vu que l'équilibre sélection-mutation aboutit à une, situation 
de « cryptopolymorphisme » avec la forme « normale » très prédominante, et 
un où quelques variants rares défavorables. Cela n’explique pas la majeure 
partie de la variation couramment observée dans le monde vivant, c'est-à- 
dire tous les cas où les différents phénotypes sont en proportions compara- 
bles. C'est à de telles situations que Ford (1940) a réservé le terme de 
polymorphisme. Il définit le polymorphisme comme « la coexistence dans 
une population de deux formes discontinues ou davantage, dans des 
proportions telles que la plus rare ne peut être maintenue par la muta- 
tion récurrente ». Par cette précision, il entendait écarter la situation de 
cryptopolymorphisme. 

Cette variabilité phénotypique est la conséquence d’un polymorphisme 
sous-jacent au niveau des gènes. Plus précisément, le polymorphisme 
génétique est la coexistence de plusieurs allèles en un locus. Par oppo- 
sition, un locus pour lequel on ne trouve qu’un allèle est dit monomorphe. 
Pour écarter le cas du cryptopolymorphisme (si on l’incluait, tous les locus 
pourraient être dits polymorphes, puisque tous peuvent muter en des formes 
défavorables), il faut ajouter que les allèles doivent être en fréquences du 
même ordre de grandeur, qu'il n'y ait pas un allèle très prédominant. Dans 
la pratique, les généticiens se fixent un seuil, un «critère de polymor- 
phisme » : le polymorphisme génétique est la coexistence dans une même 
population de deux allèles ou plus en un locus, le plus fréquent d’entre 
eux ne dépassant pas la fréquence de 0,99. Cette définition est plus opé- 
rationnelle que la précédente, mais il ne faut pas se dissimuler ce que le seuil 


94 Précis de génétique des populations 


de 0,99 a d’arbitraire (certains utilisent d’ailleurs d'autres critères, par exem- 
ple un critère de 0,95 au lieu de 0,99). Ces critères sont choisis aussi pout 
être compatibles avec l'étude d’un nombre raisonnable d'individus (de 
l'ordre de la centaine). 


En toute rigueur, et conformément à l'énoncé de Ford, la définition du 
polymorphisme suppose qu'il y a coexistence d’allèles différents au sein de 
la même population. C’est en tout cas toujours dans ce sens que nous 
l’'emploierons. L'existence de formes différentes dans des populations diffé- 
rentes ne constitue pas, à proprement parler, un cas de polymorphisme (on 
doit parler plutôt, dans ce cas, de polutupisme). 

Le polymorphisme est un fait d'observation courante : la couleur des 
yeux, des cheveux, les groupes sanguins chez l'homme ainsi que la taille ou 
la musculature, ou encore la couleur du pelage chez les chats, sont des 
exemples parmi bien d’autres. La plupart des différences que nous consta- 
tons entre les individus se ramènent à des cas de polymorphisme génétique, 
même s’il n’est pas toujours facile de préciser les unités génétiques en cause. 


Or ce fait banal constitue, à bien y réfléchir, un paradoxe flagrant : si le 
moteur de l’évolution est bien la sélection exercée par le milieu, comme 
Darwin l’a proposé, nous devrions nous attendre que la structure héréditaire 
qui se reproduit le plus efficacement soit la seule à subsister à terme. Une 
population ne devrait donc comporter généralement qu'un allèle à chaque 
locus, à la mutation près. Aussi une explication possible, lorsque nous nous 
trouvons en face d'allèles polymorphes, est-elle que la sélection n’agisse 
pas : il s'agirait d'un polymorphisme neutre (un polumorphisme et des 
allèles sont dits neutres sélectivement si le remplacement d'un allèle par 
un autre ne modifie pas les valeurs sélectives des individus qui les possè- 
dent). Toutefois, dans ce cas, la dérive doit opérer, et nous savons qu’elle 
aboutit, elle aussi, à l’'homogénéité. 

Pour expliquer l'existence au sein des populations d’une diversité sous 
contrôle génétique, nous ne pouvons donc échapper au dilemme suivant : 


ə soit il existe un mécanisme sélectif responsable du maintien du 
polumorphisme : c’est l'hypothèse sélectionniste; 
~ © soit les allèles polymorphes sont neutres mais alors la population n’est 
pas à l'équilibre : c’est l'hypothèse neutraliste. 


Jusqu'à une époque assez récente, les exemples de polymorphisme que 
l’on pouvait donner portaient le plus souvent sur des caractéristiques 
morphologiques ou de coloration. Peu de gènes avaient été identifiés avec 
précision et il y avait généralement, entre les gènes analysés et leur expres- 
sion, une grande distance, en termes de complexité des mécanismes biolo- 
giques mis en jeu. Quelques rares exemples étaient cependant bien étudiés : 
ainsi, les groupes sanguins, connus en nombre croissant depuis le début du 
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siècle ont fait l’objet de nombreux travaux de génétique des populations 
humaines. Il était toutefois difficile d'estimer le nombre de locus polymor- 
phes au sein d’une espèce ou d'une population : l'existence même d’un 
locus non polymorphe ne pouvait être détectée que lorsqu'on avait eu la 
chance de trouver un variant rare (cryptopolymorphisme). La plupart des 
généticiens évaluaient le nombre de locus polymorphes dans une population 
à quelques dizaines, peut-être quelques centaines : avec seulement 25 locus 
polymorphes, et même si ceux-ci ne comportent que deux allèles par locus, 
il peut exister 325 génotypes différents, soit près de 1012 : c'est bien plus 
qu'il n’en faut pour rendre compte de la variabilité phénotypique observée. 
On dispose, depuis les années 1960, d'un moyen de quantifier l'impor- 
tance du polymorphisme au niveau même des produits des gènes grâce à la 
technique de l'électrophorèse des protéines sur gel d'amidon ou d'acryla- 
mide, que Lewontin et Hubby (1966) ont eu l'idée d'appliquer à ce pro- 
blème. Une goutte d’un extrait protéique, souvent obtenue par simple 
écrasement des tissus, est déposée sur une plaque de gel imbibée d'une solu- 
tion d'électrolytes, et dans laquelle on établit un champ électrique (fig. 4). 
Chaque protéine se déplace dans ce champ avec une vitesse qui est fonction 
de sa charge; ces molécules prennent donc, après un temps défini, une posi- 
tion caractéristique par rapport au front de migration. Si l'on arrête alors la 
migration et qu’on met en contact avec le gel un produit pouvant servir de 
substrat à une réaction enzymatique et donnant un produit coloré, on obser- 
vera une bande à l'endroit où se sont arrêtées les molécules de l'enzyme cor- 
respondante. On peut alors distinguer des isozymes, enzymes avant des 
fonctions voisines puisqu'elles sont actives sur le même substrat artificiel. 


Lorsque le gène subit une mutation, l'enzyme qu'il code peut perdre 
totalement son activité. Dans ce cas, la bande correspondante sur le 
« zymogramme » disparaît : on est en présence d’un « allèle nul ». En fait, on 
trouve peu d’allèles nuls car ceux-ci sont le plus souvent contre-sélectionnés 
et ne subsistent qu’en fréquence très faible dans les populations (cryptopoly- 
morphisme). Il peut arriver, au contraire, que la mutation respecte l’activité 
enzymatique, au moins qualitativement, et donne une « enzyme allèle » de 
l'enzyme d’origine (on parle d’allozyme). C’est le cas notamment pour cer- 
taines mutations ponctuelles qui remplacent un acide aminé par un autre. 
L'examen du code génétique montre qu’une substitution d’une base dans 
l'ADN entraîne environ une fois sur trois un remplacement d’un acide aminé 
par un acide aminé chargé différemment; il en résulte une modification de 
la charge globale de la protéine, donc de sa mobilité électrophorétique. Dès 
lors, la bande, au lieu d’être supprimée, se trouve légèrement décalée. Ainsi, 
en un locus déterminé, l’étude d’un nombre suffisant d'individus révèle 
souvent plusieurs allèles. 


Un intérêt particulier de cette méthode est qu'elle révèle aussi bien les 
locus non polymorphes, contrairement aux méthodes génétiques classiques. 
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Bandes colorées 
montrant l'emplacement Électrode 
des enzymes 


Ligne d'insertion Gel 


des échantillons 


Figure 4a : L'ÉLECTROPHORÈSE SUR GEL est une méthode qui 
permet d'évaluer l'importance de la variabilité génétique dans les 
populations naturelles grâce à l'examen des variants protéiques des 
divers individus. Dans un premier temps, on prélève un échantillon 
de tissu de chaque organisme et on en extrait les protéines; chaque 
extrait protéique est ensuite disposé sur un gel d’amidon, d’agar ou 
de polyacrylamide. Puis on fait passer un courant dans le gel pen- 
dant quelques heures; chacune des protéines de l'échantillon migre 
alors à travers le gel selon une direction et à une vitesse qui dépen- 
dent de sa charge électrique et de son poids moléculaire. Au terme 
de la migration, on recouvre l'ensemble du gel d’une solution conte- 
nant le substrat spécifique de l'enzyme étudiée et un réactif coloré. 
L'enzyme présente dans le gel catalyse la conversion du substrat en 
un produit qui se combine avec le réactif pour donner une bande de 
couleur à l'endroit où la protéine a migré. Comme les divers allèles 
d’une même enzyme diffèrent par leur structure moléculaire et par 
leur charge (et ont par conséquent des mobilités différentes dans un 
champ électrique), il est possible de visualiser pour chaque individu, 
la composition génétique du locus qui code pour une enzyme don- 
née, d’après le nombre et la position des bandes électrophorétiques. 
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Figure 4b : CE GEL ÉLECTROPHORÉTIQUE a été coloré pour la 
malatedéhydrogénase, enzyme qui intervient dans le métabolisme 
respiratoire. Ce gel représente les migrations respectives de cette 
enzyme chez 22 mouches appartenant à l'espèce Drosophila equi- 
noxialis. Deux variants polypeptidiques (c’est-à-dire deux chaînes pro- 
téiques codées par deux allèles différents) apparaissent dans cette 
expérience : un polypeptide à migration rapide (désigné par R) et un 
autre à migration lente (désigné par L). La malate-déshydrogénase 
est constituée de deux chaînes polypeptidiques qui se combinent 
spontanément après leur synthèse; les individus homozygotes ne 
fabriquent qu'une forme de cette enzyme (soit RR, soit LL), alors que 
les hétérozygotes en fabriquent trois : R, LL, et RL (la dernière forme 
est de mobilité électrophorétique intermédiaire). À l’électrophorèse, 
les homozygotes se présentent donc sous la forme d’une seule bande, 
alors que les hétérozygotes en ont trois. Un tel cas, qui ne fait inter- 
venir que deux allèles, représente une situation simplifiée : en fait, 
un certain nombre de locus codant pour les protéines ont jusqu'à 
cinq allèles ou plus dans les populations. 


On a donc pu estimer, par ce procédé, la diversité génétique dans de nom- 
breuses populations. Les individus sont souvent hétérozygotes pour quelque 
10 % de leurs locus, et sur la totalité d’une espèce, une très forte proportion 
des locus (30 à 80 %) présente de la variabilité, soit plusieurs milliers en 
extrapolant à l'ensemble du génome. 


Plus récemment, le développement des techniques de biologie molécu- 
laire a permis d'aborder l'étude du polymorphisme au niveau de l'ADN lui- 
même. Le séquençage est une méthode trop lourde pour être couramment 
pratiquée à l'échelle des populations, mais d’autres techniques, comme la 
mise en évidence du polymorphisme dans les sites de restriction de l'ADN, 
peuvent être utilisées. On a ainsi révélé une large variabilité entre individus 
pour le nombre et la position de divers sites de restriction (on parle de poly- 
morphisme de longueur des fragments de restriction, ou plus 
couramment, selon l'abréviation anglaise, de RFLP) (fig. 5). Ce polymor- 
phisme concerne tout le génome, y compris et surtout les portions non 
codantes qui n'étaient pas accessibles par l'étude des protéines. 


98 Précis de génétique des populations 


y 


1) Disséquer 2) Centrifuger pour isoler 
et homogénéiser les tissus les mitochondries 


huile minérale 


Protéines, 
SDS 
ADNn 
glycogène 
ARN 
3) Purifier ADNmt 4) Digérer lADNmt et marquer 
dans un gradient de CsCl; (à la radioactivité) les extrémités 


récupérer la bande de l'ADNmt 


5) Développer l'autoradiographie 


Figure 5a : Protocole général pour l'analyse de RFLP d'ADN mito- 
chondrial (ADNmt). 


La découverte de cette quantité de polymorphisme a conduit les généti- 
ciens des populations à revoir leurs hypothèses sur les mécanismes de main- 
tien de la variabilité, que nous allons maintenant considérer. 
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Figure 5b : RFLP 


Lorsque deux individus, que l’on va supposer homozygotes pour des 
raisons de simplicité, sont comparés après digestion de leur ADN par 
un enzyme donné et hybridation avec une sonde donnée, trois situa- 
tions élémentaires peuvent se présenter : 


eau voisinage de la région du génome reconnue par la sonde, les 
sites de restriction sont les mêmes, et il n’y a pas de différence 
d’insertian-délétion : les profils sont indentiques (1), 


«il y a des différences au niveau des sites de restriction, sans diffé- 
rences d’insertion-délétion : les profils sont différents (2), 


eil y a des différences d'insertion-délétion, sans différences au 
niveau des sites de restriction : les profils sont différents (3). (D'après 
de VIENNE, D., 1997. Les marqueurs moléculaires et leurs applica- 
tions, série « Biotechnologies végétales » dirigée par Y. DEMARLY. 
Coordinateur scientifique Emmanuel PICARD. UNISAT Université 
audio-visuelle francophone. CNED/AVPELF-UREF). 
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2.1 POLYMORPHISME ÉQUILIBRÉ 
PAR LA SUPERDOMINANCE DE LA VALEUR SÉLECTIVE 


La formule de la variation des fréquences géniques du fait de la sélection : 


wj- w + (Wws-— w3)q 
w: p +2wọpq+w3:q 


montre que la sélection seule doit être capable d'expliquer l'existence d'un 
état d'équilibre polymorphe. 

L'état d'équilibre se définit par Ap = 0. 

L'état polymorphe se traduit par pq + 0. 

Si Ap = 0 et que pq + O, la seule solution est : 


(w,-w2)p +(w:-w3)q = 0 
Or p > 0 et q > 0, donc il faut que : 
wo € [w;,w3] 


Autrement dit, si w, > w, > w3 ou si wi < Wz < wg (ce qui représente tous 
les cas de dominance complète ou intermédiaire du caractère valeur sélec- 
tive), aucun équilibre polymorphe n’est possible avec les hypothèses faites. 
Nous avons vu que ces situations aboutissent à la fixation de l’allèle favorable 
(A et a respectivement). Restent deux possibilités : w, < w2 > w3 ou 
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w > wo < w3. Dans ces cas, il existe une fréquence d'équilibre p, qui appar- 
tient à JO ; 1[, telle que : 


(w1 -Ww2)Pe +(w2-wa)(1-pe) = 0 
soit : 
ps Wo — W3 
R Zw- Wy- W3 


Nous avons trouvé un équilibre {en plus des deux équilibres non polymor- 
phes qui existent toujours). Il reste à chercher si, à partir d'une fréquence 
quelconque, on converge bien vers cette valeur, c’est-à-dire si cet équilibre est 
stable. Pour ce faire, cherchons dans quel sens évolue la fréquence p si elle 
s'écarte de l'équilibre d’une petite quantité k; la fréquence de A est alors : 


P= petk (avec k < O ou k > 0) 
pa let OU w3)(1-p,-k) 


w- p 24 2w,pq + wz- q 


d'où: Ap = 


Ap a le signe du numérateur, qui permet d'écrire, en remplaçant p, par 
sa valeur : 


k- (w1-2: w+ w3) 


e Quand k > 0, c'est-à-dire p > pe, ceci est positif (donc p augmente) si 
w; > Wg < w3, et négatif (donc p diminue) si w4 < Wg > W3. 

e Quand k < 0, c'est-à-dire p < p,, ceci est positif (donc p augmente) si 
w < W2 > wa, et négatif (donc p diminue) si w, > wg < wg. 


En définitive, lorsque la valeur sélective de l’hétérozygote est inférieure à 
celle des deux homozygotes (w; > wọ < w3), si p est supérieur à pe, p aura 
tendance à augmenter encore, et à s’écarter de plus en plus de pẹ à chaque 
génération. Inversement, si p est inférieur à p,, il diminuera au fil des géné- 
rations. Il est donc clair que l'« équilibre » p, n'est pas stable : même si on 
partait de p = p,, la moindre perturbation (mutation, fluctuation aléatoire) 
entraînerait la perte de cet équilibre. La fréquence du gène dans la popula- 
tion va évoluer vers les équilibres stables O ou 1 selon sa valeur de départ 
(inférieure ou supérieure à p,). 

À l'opposé, si w < wp > Wa, alors l'équilibre p, est stable : quelles que 
soient les fréquences de départ, la fréquence du gène A tend vers pe. 

I! suffit donc que la valeur sélective des hétérozygotes soit supérieure à 
celle des homozygotes pour obtenir un polymorphisme stable. 

Cette situation s'appelle la superdominance de la valeur sélective (pour 
un caractère mesurable, on dit qu’il y a dominance intermédiaire si l'hétéro- 
zygote est quelque part entre les deux homozygotes, dominance complète 
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s’il est égal au meilleur homozygote [ou au moins bon}, et superdominance 
s'il est au-delà). 

Le rôle de la superdominance dans l'existence du polymorphisme a long- 
temps été considéré comme primordial; il est aujourd'hui assez controversé. 


En effet, si l’on connaît de très nombreux cas où les individus issus de 
croisements entres souches différentes sont supérieurs à leurs parents (supé- 
riorité de taille, de vitesse de croissance, de valeur sélective... : c'est ce que 
l’on appelle la vigueur hybride ou hétérosis), il est souvent possible 
d'interpréter cette supériorité comme résultant de l'addition des effets favo- 
rables des gènes apportés par les parents, mais on n’a pu qu’exceptionnel- 
lement démontrer qu'il s'agissait d’allèles; il peut s'agir, le plus souvent, de 
complémentation. L’hétérosis peut donc très bien s'expliquer, dans la plu- 
part des cas, sans faire appel à la superdominance. 


Toutefois, il existe au moins un exemple de superdominance pour lequel 
une analyse assez complète de la situation existe : c'est l’anémie falciforme. 


L'hémoglobine humaine est une protéine formée de deux monomères 
polypeptidiques, œ et 8. La molécule R comporte 148 acides aminés, dont 
le sixième est un acide glutamique. Une mutation ponctuelle du sixième 
codon peut transformer l'acide glutamique en valine; la molécule ainsi trans- 
formée manifeste des propriétés aberrantes, se traduisant par différentes 
anomalies sanguines chez les homozygotes : les hématies prennent, à pres- 
sion d'O; normale, une forme contournée évoquant la forme d’une faucille 
(d'où le nom de globules falciformes) provoquant un blocage des capillaires 
et une anémie généralement mortelle pour le nouveau-né. Cette maladie 
génétique est appelée drépanocytose ou anémie falciforme. 


Le gène de la drépanocytose peut exister chez les populations européen- 
nes, en situation de cryptopolymorphisme; il y a dominance du gène 
normal, en ce sens que les parents d’anémique(s), obligatoirement hétéro- 
zygotes, sont sensiblement normaux, bien que leurs hématies contiennent 
les deux types d'hémoglobine; l’homozygote récessif est, quant à lui, létal. 
Le gène est maintenu en fréquence très faible. 


La situation est très différente dans les zones impaludées d’Afrique noire, 
où la fréquence du gène muté peut dépasser 10 %; il y a alors un réel poly- 
morphisme, qui s'explique par une situation de superdominance. On a 
démontré, en effet, que les globules des hétérozygotes qui contiennent le 
mélange des deux hémoglobines étaient lysés plus rapidement que les héma- 
ties normales, si bien que le parasite n'avait pas le temps d'y terminer son 
cycle de développement. Les hétérozygotes sont donc indemnes de la malaria 
(malaria et paludisme sont synonymes); leur longévité moyenne et leur taux 
de reproduction sont donc plus grands que ceux des homozygotes normaux. 


Quelques autres cas de superdominance ont été rapportés dans la littéra- 
ture. L'un d'eux est directement issu de l'étude du polymorphism enzymatique 
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par électrophorèse : il s'agit de l’alcool-déshydrogénase, ou Adh, de la 
Drosophile; pour cet insecte, la désalcoolisation du milieu est une fonction 
importante. Il n'est donc pas surprenant que l'Adh représente 1/100 du poids 
total de l'animal. Les études d’allozymes ont révélé l'existence d'un polymor- 
phisme du gène de l’Adh, avec deux allèles. La fréquence de ceux-ci varie en 
corrélation avec les doses d’éthanol auxquelles sont soumises les populations. 
Les deux protéines correspondantes ont été analysées, et se sont révélées 
avoir des conditions d'activité différentes : sensibilité à la température, pH 
optimum... Il semble que l'hétérozygote possédant les deux protéines soit 
capable de faire face à des conditions plus diverses que les homozygotes. Il 
serait donc plus apte qu'eux à utiliser un milieu diversifié, dans l'espace ou 
dans le temps; mais dans une condition de milieu déterminée, il ne se montre 
pas plus performant que l’un ou l’autre des homozygotes. Dans une telle situa- 
tion, où l’hétérozygote n'est jamais supérieur aux deux homozygotes à un ins- 
tant donné, mais seulement en moyenne sur une gamme de milieux, on parle 
plutôt de superdominance marginale. 


Cet exemple, quoique moins bien démontré, est peut-être plus intéres- 
sant que celui de l’anémie falciforme, car plus facilement généralisable à 
d’autres locus. 


Le polymorphisme ne peut donc s'expliquer, dans le cadre de notre 
modèle, que par la superdominance. Jusque dans les années soixante, c’est 
généralement elle qui était invoquée pour expliquer la plupart des cas de 
polymorphisme alors connus. Avec l'avènement des techniques d'électro- 
phorèse qui révélaient une quantité impressionnante de polymorphisme et 
permettaient de reconnaître facilement les hétérozygotes (contrairement à 
la plupart des marqueurs morphologiques étudiés auparavant), on s’atten- 
dait à découvrir de nombreux autres exemples de superdominance. Mais 
cet espoir ne s'est pas réalisé : les cas démontrés de superdominance, et 
même de sélection agissant sur des polymorphismes enzymatiques restent 
rares ou équivoques (même pour l’Adh de la Drosophile, l'intervention de la 
sélection est très probable, mais l'existence de la superdominance reste 
douteuse). 


Il faut souligner que la mise en évidence d’une sélection naturelle s'exer- 
çant sur un locus particulier est souvent difficile. Pour des raisons pratiques 
d’abord : dans beaucoup de cas, les fonctions exactes in vivo des enzymes 
révélées par électrophorèse sont inconnues: tester tous les facteurs sélectifs 
envisageables est une tâche sans fin; les différences de valeurs sélectives 
entre individus sont souvent faibles, et obtenir des données sur la survie et la 
fertilité des différents génotypes dans différentes conditions de milieu est un 
travail colossal. À cela s'ajoute une difficulté théorique : les individus diffè- 
rent inévitablement par de nombreux gènes, et on ne peut jamais être sûr 
qu'une différence sélective observée est due au gène étudié, et non pas aux 
gènes voisins qui seraient en déséquilibre de liaison avec lui. 
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Néanmoins, la rareté apparente des cas de superdominance, le fait que le 
polymorphisme enzymatique soit aussi considérable chez les organismes 
haploïdes que chez les diploïdes (les plus hauts niveaux de polyumorphisme 
observés le sont chez des bactéries!) ont jeté un fort doute sur l'importance de 
ce phénomène dans le maintien de la variabilité, et si la part de la superdomi- 
nance reste encore un sujet débattu parmi les généticiens, force a été de recher- 
cher d’autres mécanismes pouvant expliquer le maintien du polymorphisme. 


2.2 VALEURS SÉLECTIVES VARIABLES 


Nous avons supposé, jusqu'ici, que les valeurs sélectives sont constantes; 
dans ce cas, la superdominance est le seul mécanisme pouvant maintenir un 
polyumorphisme à l'équilibre. Mais le polymorphisme peut aussi être main- 
tenu par la sélection si les valeurs sélectives sont variables. 


e Elles peuvent être variables en fonction des fréquences géniques elles- 
mêmes: w = f (p); c'est la sélection fréquence-dépendante; cette 
dénomination résulte de ce que la valeur sélective d’un génotype n'est pas 
une constante, mais varie avec la fréquence des génotypes dans la popula- 
tion. Plus précisément, et sans entrer dans la formalisation mathématique de 
ce type de sélection, on conçoit que le polymorphisme est maintenu si un 
allèle est avantagé lorsqu'il devient rare (encadré 6); il va donc remonter 
en fréquence : la sélection s'oppose à sa disparition (pour ce type de sélec- 
tion, on a proposé aussi les appellations « avantage du rare » ou « sélection 
apostatique », allusion plaisante au fait que c’est celui qui ne fait pas comme 
les autres, l'apostat, qui est favorisé). Bien qu’à première vue, une telle sélec- 
tion puisse paraître peu plausible, il y a plusieurs situations où cela peut se 
produire. On a montré, par exemple, que les prédateurs s’attaquent de 
préférence aux proies qu'ils reconnaissent, donc à celles dont l'aspect 
correspond au type le plus fréquent, qui est de ce fait contre-sélectionné, 
jusqu’à ce qu'il ne soit plus le plus fréquent. De même, les pathogènes évo- 
luent en développant des virulences contre les génotypes les plus communs 
dans les populations d'hôtes, de sorte que, parmi ceux-ci, les génotypes 
rares peuvent être favorisés. Par ailleurs, si différents génotypes ont des 
façons différentes d'exploiter les ressources du milieu (des «niches 
écologiques » différentes) ou des besoins légèrement différents, cela favorise 
les types les plus rares qui ont moins à souffrir de la compétition avec leurs 
congénères et, ayant ainsi une valeur sélective supérieure, augmenteront, ici 
encore, jusqu'à ne plus être les plus rares; cette situation peut avoir une 
valeur très générale. Enfin l’hétérogamie entraîne aussi, comme nous 
l'avons vu, une sélection qui avantage la forme rare. 


e Les valeurs sélectives peuvent être variables dans l’espace ou dans 
le temps. En effet, le milieu n'est pas homogène : il peut comporter des 
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ENCADRÉ 6 : LE CONCEPT DE POLYMORPHISME PROTÉGÉ 


Une condition suffisante du maintien d'un polymorphisme est que, si un allèle est en 
fréquence très faible, il doit toujours tendre à augmenter en fréquence à la génération 
suivante : si cela est vrai pour chacun des allèles en présence, il est clair que le polymor- 
phisme ne peut pas être perdu. Le polymorphisme est dit protégé. Pour voir si un poly- 
morphisme est protégé ou non, il suffit donc d'étudier ce qui se passe lorsque la 
fréquence de chaque allèle, successivement, tend vers 0. Cela revient à étudier la sta- 
bilité de chacun des points p,= 0, p; étant la fréquence du £ allèle : le polymorphisme 
est protégé si tous ces points sont des équilibres instables. 


L'intérêt de cette approche est que les situations correspondant à ces bornes sont 
généralement plus simples à analyser : les équations se simplifient. Cette méthode est 
particulièrement utile lorsque l'on doit analyser des situations complexes (allèles mul- 
tiples, sélections variables...) où la recherche explicite des points d'équilibre 
«intérieurs » (p; tous loin de O ou 1) s'avère difficile (on peut d’ailleurs avoir un 
polymorphisme protégé sans qu'il existe d'équilibre interne, les fréquences oscillant ou 
parcourant des cycles, ou avec plusieurs équilibres possibles). 


Pour illustrer la simplicité de cette méthode, nous nous contenterons de reprendre 
l'analyse du cas de sélection à valeurs sélectives constantes avec deux allèles A, a 
dans une population panmictique : si l'allèle a est rare, il n'existe pratiquement que 
les génotypes AA et Aa; on voit que a ne sera pas perdu (sera protégé) si les Aa ont 
une valeur sélective supérieure à celle des AA (si w, > w.). Inversement, quand A est 
rare, les seuls génotypes présents sont Aa et aa, et pour éviter la perte de A il faut 
que w, soit supérieur à w. On retrouve ainsi la condition de la superdominance : 
m < m > m. 


Ceci peut aussi s'exprimer mathématiquement : nous avons vu que : 


Z w p +1/2. w: 2pq 


1 2 2 
wW -p +2: w: paw: q 


Si p tend vers 0 et que g tend vers 1, ceci se simplifie beaucoup en : 


w: p 
W3 


p= 


(les autres termes sont négligeables). Pour que p augmente (p' > p), il faut donc que 
w, > w; . l'étude symétrique de q à l'autre borne (p = 1, q = 0) fournit le reste de la 
condition du maintien du polymorphisme : w, > w4. 
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« micro-habitats », dont chacun convient mieux à un génotype particulier. 
On conçoit qu'une telle situation puisse faciliter le maintien d’un polymor- 
phisme génétique. Il y a à cela certaines conditions cependant. Si la 
« maille » des variations spatiales de l'environnement est fine par rapport au 
déplacement des individus, de sorte que chaque individu expérimente au 
cours de sa vie l’ensemble des micro-habitats, c'est le génotype ayant en 
moyenne la meilleure valeur sélective sur l'ensemble des micro-habitats qui 
est avantagé. Ce meilleur génotype peut éventuellement être l'hété- 
rozygote : on retombe sur la superdominance marginale; mais si c'est un 
homozygote, le polymorphisme n’est pas maintenu. En revanche, si l'envi- 
ronnement est à « mailles larges », chaque individu n'expérimente générale- 
ment qu'un seul habitat dans sa vie, ce sont les génotypes spécialistes de 
chaque habitat qui sont favorisés et on peut, sous certaines conditions, 
maintenir un polymorphisme sans qu'il y ait superdominance, même margi- 
nale. Il s’agit bien de polymorphisme au sens où nous l'avons défini, et non 
de polytypisme, si la reproduction a lieu entre individus vivant dans les diffé- 
rents habitats, de sorte qu’on a bien affaire à une seule population. Ce peut 
être assez facilement le cas chez les plantes, où les individus sont inféodés à 
un habitat, mais où la dispersion du pollen et des graines assure les échanges 
génétiques entre habitats. 


Un des cas les mieux étudiés de polymorphisme lié à un environnement 
en mosaïque est fourni par des populations d'Avoines sauvages introduites 
en Californie depuis la colonisation espagnole. Dans certaines populations 
de cette espèce autogame coexistent, à quelques décimètres de distance, des 
individus génétiquement différents, les uns montrant une adaptation à des 
micro-habitats plus secs, les autres plus humides, selon le micro-relief du ter- 
rain et la nature du sol. Le passage d’un micro-habitat à l’autre s’accompa- 
gne quasi automatiquement du remplacement d’une forme par l'autre. Or, 
ces deux types d'individus s'avèrent différer par leurs allèles à de nombreux 
locus, y compris des locus enzymatiques ou morphologiques sans relation 
apparente avec l’adaptation. 


Dans le même ordre d'idées, des fluctuations temporelles de l'environne- 
ment favorisant alternativement différents génotypes peuvent permettre le 
maintien du polymorphisme. Ici encore, il faut que les fluctuations soient assez 
lentes pour que chaque individu n’expérimente pas l'ensemble des conditions 
(ainsi, les variations saisonnières ne peuvent pas favoriser le polymorphisme 
chez les Chênes, mais elles peuvent jouer un rôle pour des populations de 
Daphnies, de Drosophiles, ou de micro-organismes ayant de nombreuses 
générations par an). Elles doivent par ailleurs être assez rapides pour qu'aucun 
des allèles n'ait le temps de se fixer dans la période où il est favorisé. 

Tous ces cas nous amènent à constater que les mécanismes conservant 
le polymorphisme par une variation des valeurs sélectives ressemblent 
beaucoup à ceux qui sont invoqués pour expliquer la coexistence de diverses 
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espèces dans un même milieu. Ce sont fondamentalement les mêmes. Ils ne 
maintiennent pas exclusivement la variabilité intraspécifique qu'est le 
polymorphisme, mais entrent dans un ensemble plus vaste qui est celui des 
causes de la diversité du monde vivant dans son ensemble, de la biodiversité. 
C'est d’ailleurs cette question de la coexistence d'espèces différentes dans 
un même milieu qui a amené l’élaboration du concept de niche écologique. 
La superdominance est le seul mécanisme qui soit strictement réservé à la 
variabilité intraspécifique, à la génétique des populations des organismes 
diploïdes, objets de cette étude. Tous les autres facteurs de maintien de la 
biodiversité sont du ressort de l'écologie générale. 


2.3 POLYMORPHISME TRANSITOIRE 


Si un allèle nouvellement apparu dans une population par mutation ou 
par migration confère à ses porteurs une valeur sélective supérieure, il va 
remplacer l’ancien allèle, à moins qu'il ne soit perdu par dérive aléatoire 
lorsqu'il est encore très rare : en effet, un gène apparu par mutation n’est 
présent au départ qu’en un exemplaire dans un individu, et, même s’il 
confère une valeur sélective supérieure à son porteur, sa probabilité de perte 
dans les premières générations est forte. En revanche, dès qu'il atteint une 
fréquence appréciable, la probabilité de perte d'un gène favorable devient 
presque nulle, sauf dans une population vraiment très petite. 


Si le nouvel allèle n’est pas perdu, il se substitue à l’ancien, mais cette 
substitution prend un certain temps, d'autant plus grand que la différence de 
valeur sélective entre les individus ayant l’ancien allèle et ceux ayant le 
nouveau est faible. Pendant toute la période où le nouvel allèle augmente en 
fréquence aux dépens de l’ancien, on observe un polymorphisme, mais qui 
n'est que transitoire. 


La même situation s'observe si le milieu se modifie de manière qu'un 
allèle auparavant défavorable, qui ne pouvait être maintenu qu’à l’état cryp- 
topolymorphe, devient favorable. L'exemple le plus célèbre d’une telle situa- 
tion est celui du mélanisme industriel, étudié en particulier en Angleterre 
chez la Phalène du bouleau : à partir de 1850, une forme noirâtre de ce 
Papillon a remplacé la forme claire dans les régions industrielles où la pollu- 
tion a assombri les paysages par les dépôts de suie et la destruction des 
lichens. Cela s'est fait dans certaines zones en moins de cinquante ans; 
sachant que cette espèce n'a qu'une génération par an, un remplacement 
aussi rapide est le signe d’une forte sélection. C’est la prédation par les 
oiseaux, plus forte sur la forme la plus visible, qui est le facteur sélectif. 

Une telle inversion du sens de la sélection, de même que l'apparition d’un 
nouveau mutant favorable, doivent être des éventualités plutôt rares. La part 
du polymorphisme qu’elles expliquent est sans doute limitée. 
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2.4 LE PROBLÈME DU FARDEAU GÉNÉTIQUE 


L'hypothèse de la superdominance pour expliquer le polymorphisme a 
longtemps paru suffisante à la plupart des généticiens, tant que la quantité 
de polymorphisme était inconnue. 


La découverte à partir des années 1960 du polymorphisme intense des 
populations naturelles grâce à l’électrophorèse a posé aux évolutionnistes 
un certain nombre de problèmes. Nous en avons déjà évoqué certains, mais 
le plus important est le problème du fardeau génétique (genetic load). 


De façon générale, on appelle fardeau génétique la diminution de 
valeur sélective d’une population due au maintien d'individus 
ayant des valeurs sélectives différentes. Il peut être mesuré par : 


LS Wmax 7 W 


Wmax 


où Wmax est la valeur sélective des meilleurs individus de la population, et w 
la valeur sélective moyenne. Il représente donc la proportion d'individus de 
la population éliminés par la sélection, comparée à une population qui ne 
contiendrait que les meilleurs génotypes. 

La mutation, qui produit sans cesse des individus tarés, est responsable 
d'un fardeau de mutation existant dans les populations. Nous en avons 
parlé à propos du cryptopolymorphisme. 

Le polymorphisme transitoire crée, pendant la période de remplace- 
ment, un fardeau de substitution. 


Dans le cas d'un polymorphisme équilibré, c’est le maintien du polymor- 
phisme sur lequel s'exerce la sélection qui produit un fardeau génétique; on 
parle de fardeau de ségrégation, puisque c’est la ségrégation mendé- 
lienne, à chaque génération, qui refabrique des individus de valeur sélective 
moindre (par exemple, dans le cas de la superdominance, on ne peut main- 
tenir 100 % d’hétérozygotes en reproduction sexuée; des 
défavorables sont ségrégués à chaque génération). Paradoxale 


sélection elle-même, responsable du maintien du polymorphisme, qui, ici, 
maintient le fardeau! 


On peut essayer d'appréhender ce problème sur un exemple simple 
(mais irréaliste). 


Prenons un cas de superdominance extrême : w, = l;w, = w; = 0. Le 


polymorphisme est maintenu à p, = q; = 5 ; 
Les zygotes produits à chaque génération ont la structure : 


1 1 1 
3 AA z Aa 4 94 
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À chaque génération, la moitié des individus de la population {les homo- 
zygotes) ne se reproduit pas. Ceci impose un certain coût à la population, 
un fardeau génétique. Ainsi, dans le cas de l’anémie falciforme, ce 
fardeau est élevé : il contient la somme des individus anémiques aa et les 
homozygotes AA morts par malaria. 


ki, il ne s’agit de maintenir polumorphe par sélection qu’un seul locus, 
mais si cela se passe de la même façon sur un autre locus, cela signifie 
l'élimination d’autres individus, homozygotes à ce second locus. Il est évi- 
dent que de tels mécanismes ne peuvent maintenir beaucoup de locus à 
l'état polymorphe, car alors, une trop faible fraction de la population se 
reproduirait. Si pour chaque locus les homozygotes étaient létaux, pour 
maintenir 100 locus à l'état polymorphe par ce système, il faudrait supposer 
que la proportion d'individus se reproduisant pour former la génération 
suivante soit de l’ordre de (1/2) 1%, soit environ 10 = %, ce qui est évidem- 
ment impossible. Pour en maintenir seulement 10, il faut déjà que la propor- 
tion de reproducteurs soit de 1/1000, ce qui est inconcevable dans certaines 
espèces telles que l'espèce humaine (par exemple). Nous nous sommes 
placés dans le cas le plus défavorable : bien entendu, on peut supposer des 
différences de valeurs sélectives beaucoup plus faibles entre homozygotes et 
hétérozygotes que dans notre exemple, mais même alors, un calcul analo- 
que montre qu'il paraît impossible qu’une sélection avec superdominance 
maintienne le polymorphisme de plusieurs milliers de locus. 


Le problème est d’ailleurs le même avec tous les autres types de sélection 
pouvant contribuer au maintien du polymorphisme. En effet, toute sélection 
entraîne un coût, c’est-à-dire la non-reproduction de certains individus. Plus 
on veut sélectionner de gènes à la fois, plus ce coût est élevé car on sacrifie 
beaucoup d'individus dans la population, et plus l'effectif reproducteur réel 
est faible, ce qui a pour conséquence une dérive accélérée pour les autres 
gènes. Ce problème est bien connu des sélectionneurs, aussi bien de végé- 
taux que d’animaukx : ils se gardent bien de sélectionner d’un coup tous les 
caractères recherchés dans une nouvelle variété ou race, de peur de perdre 
par dérive une grande partie des gènes sur lesquels ils n’ont pas de prise 
directe, y compris ceux qui peuvent être intéressants. 


Le point de vue neutraliste 


Une solution radicale au problème du fardeau est de supposer que le 
polymorphisme intense observé dans les populations naturelles ne s'accom- 
pagne pas de différences de valeurs sélectives, autrement dit qu’il est sélec- 
tivement neutre. Il n'y a donc plus aucun coût. 


En revanche, il doit y avoir dérive, de sorte qu'ici le polymorphisme ne 
peut être que transitoire. Il faut donc supposer que les populations sont 
assez grandes pour que la fixation aléatoire d’un gène ne se fasse que très 
lentement, et d’autre part que la mutation réintroduit sans cesse de nou- 
veaux allèles neutres. Il en résulte une sorte d'équilibre dynamique où de 
nouveaux allèles se substituent progressivement aux anciens, avant d'être 
remplacés à leur tour, mais, globalement, la variabilité est maintenue parce 
que la mutation en recrée autant que le hasard en détruit. 


La vision neutraliste de l’évolution est donc la suivante : il se produit sans 
cesse des mutations. Celles qui sont défavorables tendent à être éliminées,; 
exceptionnellement, le nouveau gène est plus favorable que l’ancien et, s’il 
n’est pas perdu d'emblée, il le remplace assez rapidement (ce sont ces rares 
mutations favorables qui sont significatives pour l'évolution). L'originalité des 
« neutralistes » est d'affirmer que de nombreuses mutations ne sont ni favora- 
bles ni défavorables, et c'est donc le hasard qui va déterminer leur devenir : 
beaucoup de ces mutations neutres sont perdues plus ou moins vite par dérive, 
mais comme il s'en produit continuellement, l’une ou l'autre finira par se fixer. 


Dans une population de N individus (2N gènes), si nous appelons n le 
taux de mutation neutre, 2Nn nouveaux gènes neutres sont produits à 
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chaque génération. Chacun des 2N gènes de la population, muté ou non, 
aura la même probabilité de se fixer dans le futur (c’est précisément ce que 
signifie le mot « neutre »), soit une probabilité 1/2N. Par conséquent, c’est 
un nouveau gène muté de cette génération qui se fixera avec une probabilité 
1/2Nx2Nn = n. Comme ceci est vrai à chaque génération, on peut dire 
qu’il apparaît un nouvel allèle neutre destiné à se substituer à l'ancien toutes 
les 1/n générations en moyenne. Kimura, qui a développé la théorie neu- 
traliste, a montré aussi que pour une mutation qui doit se fixer, il s'écoule en 
moyenne 4N générations entre son apparition et sa fixation (N étant la taille 
de la population diploïde) : ce n’est autre que le temps de coalescence. 


C'est évidemment une durée considérable dans la plupart des espèces. 
Pendant tout ce temps, on observe du polymorphisme. La fixation est 
d’ailleurs toute provisoire puisqu’une autre mutation neutre la remplacera à 
son tour. Si la population est assez grande (4N > 1/n), l’allèle destiné à 
remplacer celui en cours de fixation est déjà apparu et en train d'augmenter 
à son tour en fréquence, de sorte qu’à tout moment on observe un polymor- 
phisme avec généralement plus de deux allèles par locus (fig. 6). 


Il apparaît donc aussi que le rythme de substitution d’un allèle neutre 
par un autre est indépendant de la taille de la population, puisqu'il est égal à 
1/n (c'est-à-dire que si le taux de mutation neutre est de 107°, il y a substi- 
tution d’un allèle par un autre allèle en moyenne toutes les 105 générations). 


La comparaison des séquences de protéines de divers organismes a mon- 
tré que le rythme d'évolution de certaines séquences protéiques était essen- 
tiellement constant. Ainsi, chez toutes les lignées de Vertébrés, la séquence 
de l’hémoglobine a a évolué au rythme d'environ une substitution tous les 
600 000 ans, et ce, aussi bien dans les lignées qui ont connu une forte et 
rapide évolution morphologique ou écologique, comme les hominidés ou les 
ongulés parmi les Mammifères, ou les amniotes parmi les Vertébrés, que 
dans les lignées n'ayant peu ou pas évolué morphologiquement depuis très 
longtemps (Sélaciens, Salamandres ou, parmi les Mammifères, les Opos- 
sums). Cette apparente constance dans le rythme d'évolution d’une protéine 
ou d’une séquence d'ADN donnée, ce qu’on a appelé l'horloge molécu- 
laire, est un argument puissant en faveur de la théorie neutraliste (bien que 
la réelle constance de l’horloge moléculaire, comme ses causes, restent 
encore controversées). 


Le rythme d'évolution est sensiblement constant pour chaque protéine, 
mais il varie considérablement d’une protéine à l’autre : il est de 1,2 substi- 
tution par acide aminé et par milliard d'années pour l'hémoglobine a, de 0,3 
pour le cytochrome c (un transporteur d'électrons de la chaîne respiratoire), 
de 0,01 pour l’histone H; (protéine qui participe à la structure du chromo- 
some eucaryote), mais de 8,3 pour le fibrinopeptide (segment de chaîne 
polupeptidique qui, dans le processus de coagulation du sang, est séparé de 
la fibrine lors du clivage enzymatique du fibrinogène sous l’action de la 


Le polymorphisme 113 


Fréquence 
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Figure 6 — Processus de la substitution des allèles neutres (d’après 
Kimura). 

En haut : schématisation du processus. De nouveaux allèles neutres 
apparaissent sans cesse par mutation. La plupart sont perdus, mais 
certains finissent par se fixer et remplacent les anciens. Cela arrive 
en moyenne toutes les 1/n générations, n étant le taux de mutation 
neutre au locus. Le temps moyen entre l'apparition d'un nouvel 
allèle neutre destiné à remplacer l'ancien et le moment où il se fixe 
est de 4N générations, N étant la taille de la population. 


En bas: comparaison d’une population de petite taille (a) et de 
grande taille (b). Le taux de mutation neutre est le même, donc le 
taux de substitution aussi mais comme 4N est différent, on trouve à 
tout moment plus de polymorphisme neutre dans la population de 
grande taille que dans celle de petite taille. 
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thrombine). Cela ne signifie pas que le fibrinopeptide subisse plus de muta- 
tions que l’histone H4, mais que la proportion des mutations qui sont 
neutres est très différente entre ces deux protéines : l’histone H, a pratique- 
ment la même séquence chez tous les eucaryotes, de l’homme au petit pois. 
Ce doit être le signe que toute mutation modifiant sa structure primaire est 
contre-sélectionnée; au contraire, le fibrinopeptide n’a pour fonction que 
d'empêcher, par sa présence à l'extrémité N-terminale du fibrinogène 
plasmatique, la polymérisation spontanée en réseau de fibrine. La séquence 
précise des acides aminés qui le constituent n'aurait guère d'importance, 
aussi beaucoup des substitutions qui s’y produisent sont neutres. De même, 
au niveau de l'ADN, certaines séquences évoluent plus vite que d’autres : 
ainsi, les introns évoluent plus rapidement que les exons, signe que les chan- 
gements de séquence des premiers sont plus souvent sans importance fonc- 
tionnelle que pour les seconds; dans les exons, quand on compare les 
séquences d'espèces voisines, les troisièmes bases des codons ont un taux 
de substitution supérieur aux deux premières, pour la même raison. De 
façon générale, les portions non codantes du génome évoluent plus vite. 
Tout cela est le contraire de ce qu’on attendrait sur une base sélectionniste : 
si une majorité des évolutions observées étaient adaptatives, les molécules et 
séquences les plus importantes dans l'adaptation des organismes seraient 
celles que l’on voit évoluer le plus vite. 


Il est important de comprendre que la théorie neutraliste ne conteste pas 
le rôle de la sélection naturelle dans l'évolution des organismes, pas plus 
qu'ils ne contestent que le polymorphisme de l’anémie falciforme soit sélec- 
tionné. Simplement, dans ce modèle, on considère que, dans la quantité de 
polymorphismes révélés par l’électrophorèse ou l'étude de l'ADN, la plus 
grande partie est neutre, les cas de polymorphismes sélectionnés étant une 
toute petite minorité. De même, dans l’évolution des protéines, quelques 
substitutions ont certainement une signification adaptative (on ne pourrait 
peut-être pas échanger impunément l’hémoglobine a de la carpe et de 
l'homme, différentes pour 68 acides aminés), mais ces substitutions adapta- 
tives sont novées dans une masse de substitutions neutres, sans signification 
au niveau de l’adaptation. 


Le débat entre « sélectionnistes » et « neutralistes », né à la fin des années 
1960 des nouvelles données apportées par l’électrophorèse et des travaux 
de Kimura, a été très vif dans les années 1970-1980, et a donné lieu à une 
quantité considérable de recherches. Mais il est impossible de prouver qu’un 
polumorphisme est neutre (on ne peut jamais être sûr d’avoir éliminé tous 
les facteurs sélectifs) et souvent très difficile de prouver qu'il ne l’est pas. 
C’est sans doute ce qui a permis à la discussion de devenir très animée. Les 
calculs des neutralistes ont en tout cas montré que leurs hypothèses 
pouvaient rendre compte de la plupart des faits observés et permettaient des 
prédictions apparemment justes sur l’évolution moléculaire et la structura- 
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tion de la variabilité. Aussi, alors que dans les années 1950-1960 bien des 
évolutionnistes refusaient l’idée même qu’une mutation neutre puisse exis- 
ter, la plupart admettent aujourd’hui qu’une bonne part du polymorphisme 
enzymatique et de l'ADN pourrait être neutre, même si des désaccords 
subsistent sur la part respective du hasard et de la sélection. 


Exercices du chapitre C 
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Exercice C.1 


Chez trois espèces cultivées, on a procédé à la même expérience : on a 
autofécondé différentes plantes appartenant à la même variété cultivée et on 
a semé les graines issues de cette autofécondation. Certaines plantes étaient 
albinos, c'est-à-dire dépourvues de chlorophylle, un phénotype létal, la plan- 
tule mourant dès qu’elle a épuisé les ressources de la graine. La proportion 
de plantules albinos, sur 10 000 graines semées, a été : 


chez le millet 0 
chez le mil 12 
chez la vigne 2522 


Comment expliquez-vous ces résultats? Quelles sont les caractéristiques 
des variétés qu'on peut espérer commercialiser chez ces différentes 
espèces? 


Exercice C.2 


Dans une population de plantes qu'on supposera infinie (pourquoi?) 
coexistent deux allèles A, et Ap. À la génération g, on étudie les individus 
adultes de cette population. Les fréquences de ces deux allèles sont alors 
respectivement p et q (= 1 — p). La population se reproduit en panmixie. 

Quelles seront les proportions des différents génotypes dans la popula- 
tion adulte à la génération g + 1 et comment ces proportions évolueront- 
elles dans le futur : 

1) si les deux allèles n’ont aucun effet sur la valeur sélective des individus 
qui les portent? 

2) si les viabilités (probabilités de survivre du stade zygote au stade adulte) 
des trois génotypes sont égales mais que les fertilités (nombre de 
descendants fabriqués par un adulte en espérance) sont telles que : 


w(A1A45) = w(A2A2) = w(A:A:)/2 
3) Comment la réponse à la question précédente serait-elle modifiée si 
la différence portait non plus sur la fertilité mais sur la viabilité ? 


4) Application numérique : la population de départ contient : 
10 individus A,A;, 40 individus A,A, et 40 individus AA». 


D 


Problèmes 
de synthèse corrigés 


Sélection sur le taux 
d'autofécondation 


Dans une population de plantes, deux types d'individus se trouvent réu- 
nis. Ces deux types sont semblables en tout sauf en ce qui concerne le taux 
d’autofécondation. 


Les individus de type (1) autofécondent une fraction s de leurs gamètes 
femelles; les individus de type (2) autofécondent une fraction s + x de leurs 
gamètes femelles. La quantité de pollen utilisé pour l’autofécondation est 
négligeable. 

1) Combien de copies de leurs gènes les deux types d'individus laissent- 
ils dans leurs propres graines? 


2) On appellera P le nombre de copies de leurs gènes laissées par les 
plantes de type (1) via leur pollen fécondant d’autres plantes. Les graines 
issues d’allofécondation germent h fois mieux que les graines issues d’auto- 
fécondation (pourquoi h?)}. Combien de copies de leurs gènes les deux types 
d'individus laissent-ils à la génération suivante au stade plante? Comparer 
ces deux valeurs et en déduire l’évolution de la population. 


Corrigé 


1) Appelons g le nombre de graines produites par les individus; dans leurs 
propres graines, les individus s’autofécondant pour une fraction s (type (1) 
laissent g copies de leurs gènes via leurs gamètes femelles mais aussi gs via 
le pollen qui a fécondé leurs propres ovules. Au total, ces individus laissent 
g(1 +s) copies de leurs gènes dans leurs propres graines. De même, les 
autres (type (2)) laissent g(1 +s +x) copies de leurs gènes dans leurs graines. 


2) Puisque l'autofécondation ne consomme pas de pollen, les plantes de 
type (1) et de type (2) fécondent en espérance autant de plantes les unes que 
les autres. Par conséquent, les deux types de plantes auront laissé, dans les 
graines produites, des copies de leurs gènes en nombre : g(1+s)+P pour 
les plantes de type (1) et g(1+s+x)+P pour les plantes de type (2). Les 
graines issues d’allofécondation représentent respectivement g(1-s) et 
g(1-s-x) pour les deux types de plantes; le reste (soit 2sg et 2(s+ x) g) 
correspond aux gènes se trouvant dans des graines issues d’autoféconda- 
tion. Remarquons que le fait que ces graines proviennent d’autofécondation 
aboutit au fait que ces graines portent deux génomes de leur plante mère 
(père) chacune. Après germination, l’hétérosis (qui justifie le paramètre h) 
agit en favorisant les individus issus d’allofécondation. Le nombre de copies 
du génome produites sera : 


w =gh(l-s)+2sg+Ph pour le type (1) 
et w = gh(1-s-x)+2(s+x)g+Ph pourle type (2) 
La différence est donc de : 
Wo—w = gh(l-s-x)+2(s+x)g+Ph-gh(1-s)-2sg-Ph 
= glh(-s-x)+2(s+x)-h(1-s)-25s] 
gl2x-hx] 
gx(2-h) 
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On voit que selon le signe de 2 —h, la population va évoluer dans des 
directions opposées. Si h est inférieur à 2 (si les graines allofécondées sont 
moins de deux fois meilleures que les graines issues d'autofécondation), alors 
wo — w est du signe de x. C'est-à-dire que c'est le génotype qui s'autofé- 
conde le plus qui transmet le mieux ses gènes. L'espèce va devenir autogame. 


Au contraire, si h est supérieur à 2 (si les graines allofécondées sont plus de 
deux fois meilleures que les graines issues d’autofécondation), alors wz - w; est 
de signe opposé à x. C'est-à-dire que c'est le génotype qui s'autoféconde le 
moins qui transmet le mieux ses gènes. L'espèce va devenir allogame. 


Tétraploïdes 


Dans une population, un locus présente deux allèles À et a. 


1) Quels sont les génotypes en présence et leurs proportions en pan- 
mixie (en fonction des proportions respectives p et q de À et a): 


a) si l'espèce est diploïde? 
b) s'il s'agit d’un autotétraploïde? 
2) Mêmes questions en autogamie stricte et prolongée. 


3) Mêmes questions (génotypes + fréquences en panmixie et autogamie) 
pour un allotétraploïde issu de la fusion de deux espèces possédant respec- 
tivement À en proportions p4 et p, et a en proportions q; et q2- 


Corrigé 


1) Si l'espèce est diploïde, on trouve les célèbres proportions de Hardy- 
Weinberg : 
p? AA, 2pqAa et q?aa 


2) Si l'espèce est autotétraploïde, on trouve : 
pÍ AAAA, 4pq AAAa, 6p?°q? Aaaa, 4pq? Aaaa et q“*aaaa 


L'autogamie fait disparaître les hétérozygotes, on obtient donc : 


e chez un diploïde : p AA et q aa 
e chez un autotétraploïde : p AAAA et q aaaa 
3) En panmixie : AAAA pi? p2 


AAAa 2p5° P2q2 + 2P1 qıp?” 
AAaa p1°q2 + q1°p2? + 4p191 P202 
Aaaa 2p1 41927 + 2 q1° P292 
aaaa q;°q> 
En autogamie : AAAA pı po 
AÂaa p192 + q1P2 


aaaa q192 


Les chémotypes de thym 


Le thym (Thymus vulgaris L.) tire son odeur de monoterpènes. On a pu 
montrer que différents individus possédaient une odeur différente due à la 
production de molécules différentes. Ces molécules sont distinguables en 
chromatographie en phase gazeuse. Dans une population naturelle, on a 
prélevé des feuilles sur 200 individus et on les a analysées : 


e 38 individus produisaient du Linalol, molécule non cyclique (phéno- 
type [LI ; 

e 90 individus produisaient du Carvacrol, molécule phénolique (phéno- 
type [CI) ; 

e 72 individus produisaient du Thymol, molécule phénolique (phéno- 
type [T). 

1) Quelques individus ont été transplantés en pépinière et plusieurs 
générations de croisements ont été réalisées. Les parents et descendants des 
différents croisements ont été analysés. Les différents croisements ont tous 
pu être classés dans une des disjonctions données dans le tableau ci-après 
(les phénotypes sont toujours indiqués entre crochets). 

Quelle hypothèse génétique a-t-elle été utilisée? (On pourra, pour répondre, 
commencer par considérer le cas des croisements n'incluant pas [L], puis 
reprendre l'ensemble en regroupant les phénotypes [C] et [T] en un seul phéno- 
type [P] et enfin conclure en reprenant un ou quelques croisements particuliers.) 

Dans cette hypothèse, à quels génotypes les différents cas du tableau 
correspondent-ils? 
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Parents [L] 
[TIX[T] 0 
[CIxICI 0 
ICI x{C] 0 
[CIXITI 0 
[CI IT] 0 
[LJX[E] 1 
(LIXIL] i 
Lx IL] à 
[LIx IL) i 
[Lx [L] 3 
[L] x [C] 1 
ILIx[C] 5 
[L1x{C] à 
ILI XIT] 5 
EL] x [T7] 1 
[LIxUT) i 
[LIXIT) ; 
[LIX IT) È 


Descendants 
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2) Toujours dans l’hypothèse ci-dessus, quels seraient les génotypes en 
présence dans la population d’origine : 


a) Si le thym était autogame à 100 %? 


b) Si le thym était allogame et se reproduisait en panmixie pour le carac- 
tère en question? 


c) Si le thym était allogame mais que les abeilles se spécialisaient sur un 
type d’odeur (pollen transporté uniquement entre individus de même odeur)? 


3) Dans chacun de ces trois cas, quelles seraient les fréquences des diffé- 
rents génotypes en présence en fonction des fréquences alléliques? En 
déduire les fréquences alléliques dans la population de départ pour les trois 
cas considérés. De quelle(s) hypothèse(s) supplémentaire(s) avez-vous besoin 
pour répondre à ces questions ? 


Corrigé 


1) Les croisements entre les formes |T] et [C] sont typiques de la disjonc- 
tion d’un locus à deux allèles. Les croisements [T] x [T] ne donnent que des 
formes [T] tandis que les croisements [C] x [C] donnent [C] et [T]. Ceci signi- 
fie que l'information génétique codant la forme [T] peut être « cachée » dans 
des individus [C], la réciproque n'étant pas vraie. Il s'ensuit que l’allèle déter- 
minant la forme [T] (nous l’appellerons c) est récessif et que celui détermi- 
nant la forme [C] (nous l’appellerons C) est dominant. Les croisements 
[C] x [C] qui produisent des [T] les produisent bien en proportion 1/4 
comme attendu. De même, les croisements [C] x [T] qui disjoignent donnent 
les proportions attendues 1/2 : 1/2. 


Si on regroupe [C] et [T] dans une même classe (soit [P]), on retrouve 
exactement le même schéma vis-à-vis de [L]; la forme [P] est récessive face 
à [L] qui est déterminé par un allèle dominant (qu'on appellera L). 


2) On doit alors se demander si les allèles L, C et c se trouvent au même 
locus ou sur des loci différents. La dernière ligne du tableau fournit la 
réponse à cette question. En effet, le parent [T] est nécessairement de géno- 
type cc. Le parent [L] est nécessairement de génotype L* {* désigne soit L 
soit C soit c) : il ne peut pas être LL sinon tous les descendants seraient [L], 
il ne peut pas non plus être LC sinon les descendants seraient 
1/21L]+1/2[C],; il ne peut pas non plus être Le sinon les descendants 
seraient 1/2 [L] + 1/2 [T]. Il y a donc deux loci. L'un porte deux allèles L 
et ], l’autre porte deux allèles C et c. Le premier est épistatique sur le second 
en ce que la présence de l’allèle L suffit à déterminer le phénotype [L]. Seuls 
les individus présentant le génotype li à ce locus exprimeront le second locus 
déterminant les phénotypes [C] et [T]. Les génotypes des parents des croise- 
ments sont donnés dans le tableau suivant. 


a) Si le thym était autogame à 100 %, il n`y aurait que des homozygotes 
dans la population, soit les 4 génotypes : LLCC, LLcc, HCC et Hec. 
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Descendants 
Parents [L] [C] [T] 
[T] x[T] H cc Il cc 0 0 1 
[C]1x[C] ll CC il C* 0 1 0 
[CI x [€] ll Ce I Cc 0 3/4 1/4 
[CI XET] li CC ll cc 0 1 0 
[C1 X [IT] Il Ce Il cc 0 1/2 1/2 
[L] x [L] ELS LT 1 0 0 
ILIXIL] LICC LI C* 3/4 1/4 0 
IL] x [2] LI cc LI cc 3/4 0 1/4 
[L1x[L] LI Cc LI cc 3/4 1/8 1/8 
IL]Xx[L] El Cec LI Cc 3/4 3/16 1/16 
[L]x[C] LEF l1 C* 1 0 0 
[L]x[C] L" S 1/2 1/2 0 
[L1x [CI LI cc Il Cc 1/2 1/4 1/4 
[L]x [CI LI Cc Il Cc 1/2 3/8 1/8 
[L]X [IT] LL ** cc 1 0 0 
[LE] x [7] LI CC ll cc 1/2 1/2 0 
{L|x[T] LI cc ll cc 1/2 0 1/2 
[L]x[T] LI Cc I cc 1/2 1/4 1/4 


N.B. Les étoiles signifient que l'allèle présent est indéterminé. D'autre part, lorsque 
les deux parents sont équivalents (comme à la deuxième ligne) on a choisi un ordre 
mais il pourrait bien sûr être inversé. 


b) En panmixie, on trouverait 9 génotypes : LLCC, LLCc, LLce, 
LICC, LiCc, Liec, HCC, HCc et lee. 

c) L'homogamie, en faisant se reproduire ensemble les individus [L], 
aboutirait à la disparition des hétérozygotes LI ce qui laisse, pour les 
individus de type [L], trois génotypes : LLCC, LLCe et LLee. Du fait que 
les [C] et les [T] se reproduisent également entre eux, les hétérozygotes Ce 
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disparaissent quand ils sont associés au génotype II. Ce qui laisse deux 
génotypes : THICC pour les [C] et Hece pour les [T]. On peut remarquer que 
l’homogamie ne fait pas disparaître le génotype Ce quand il est associé à LL 
puisque parmi les plantes LL, il n'y a pas de différence d’odeur entre les 
CC, les Ce et les cc. À l'intérieur du groupe de reproduction des plantes LL 
(qui est un groupe fermé) il y a panmixie pour les allèles C/c. 

3) Soient p; et qı (=1 - pı) les proportions respectives de L et I et po et 
qə (=1 — p:) les proportions respectives de C et c. 


En autogamie, les génotypes seraient en proportions : 
Pı P2 LLCC, p; qz LLce, q; po HCC et q; q3 Ilce 


On en déduit que p, = 38/200 = 19 % (d'où qı = 81 %) et pə = 90/ 
162 = 10/18 (d’où qx = 8/18). 

En panmixie, on attendrait p4?p2? LLCC, 2p1?P202 LLCc, p;°q? LLec, 
2p191P2° LICC, 4p;q1p292 LICc, 2p1q1q2° Lice, q1°p2? HCC, 2q1°p2q» 
ICc et qa? Ilce. 


On en déduit que q,? = 162/200 = 0,81 d’où qı = 90 % (et pı = 10 %) 
et q2? = 72/162 = 4/9 d'où qz = 2/3 (et pọ = 1/3). 


En homogamie, à condition de supposer l'absence de déséquilibre de 
liaison entre les deux loci (ce qui dans ce cas n'est pas très raisonnable; en 
effet, les groupes LL et II sont totalement isolés et il est probable qu'ils ne 
restent pas semblables pour leurs proportions de C, etc.), on peut calculer 
les proportions des 5 génotypes : pip? LLCC, 2p;p2q2 LLCC, pq»? 
LLcc, qıp HCC et q:qo Hec. 

On en déduit (de même que pour l'autogamie étant donné qu'on ne 
« voit » que les génotypes homozygotes) que pı = 38/200 = 19 % (d'où 
qı = 81 %) et pp = 90/162 = 10/18 (d'où q = 8/18). 


Deux populations : 
l'effet Wahlund 


Deux grandes populations (V et W) isolées et panmictiques de plantes 
hermaphrodites montrent un polymorphisme. Dans chacune, on trouve des 
plantes à fleurs blanches [B] et des plantes à fleurs rouges [R]. Ce caractère 
ne modifie ni la fertilité ni la viabilité ni les conditions de fécondation des 
individus. 

I À l’intérieur de chacune de ces deux populations, on a effectué des 
autofécondations et des croisements. 


e Toutes les plantes [B] autofécondées ou croisées entre elles ont toujours 
donné des descendants [B]. 

e Certaines plantes [R] autofécondées ou croisées avec n'importe quelle 
autre plante ont donné des descendants, tous [R]. 

e Les autres plantes [R] ont donné en autofécondation environ trois des- 
cendants [R] pour un [B]. 


Quel serait le résultat d’un croisement de ce dernier type de plantes avec 
une plante [B] ? Et avec une autre plante [R] ? 

II Les fréquences des allèles responsables respectivement des types [R] et 
[B] sont p, et q, dans la population V et p,, et a,, dans la population W. Tous 
les résultats seront donnés en fonction de ces fréquences. 

1) Quelles sont les proportions des génotypes et des phénotypes dans 
ces deux populations? 
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2) On prélève un grand nombre de graines sur ces deux populations 
séparément : 


e d'une part on effectue des croisements entre plantes de ces deux popu- 
lations, 

e d'autre part, on constitue une nouvelle population, U (qu'on supposera 
de taille infinie), issue d’un mélange d’un nombre égal de graines issues des 
deux populations V et W. Ces graines sont semées et les plantes produites 
constituent la génération 0 de la population U. Ces plantes se croisent entre 
elles en panmixie. Les graines ainsi produites, les plantes qui en sont issues 
correspondent à la génération 1 de la population U. 


Nous allons envisager deux possibilités. 


a) Les très nombreux croisements effectués entre plantes à fleurs blan- 
ches des deux populations donnent toujours des descendants à fleurs blan- 
ches. Qu'en déduisez-vous ? 

Quelles sont les proportions des allèles, des génotypes et des phénotypes 
chez les plantes de la génération O de la population U? Ces proportions 
correspondent-elles aux proportions de Hardy-Weinberg? Pourquoi? 

Quelles sont les proportions des différents génotvpes dans les gamètes 
issus de la génération O de la population U? 

Quelles sont les proportions des allèles, des génotypes et des phénotypes 
chez les plantes de la génération 1 de la population U? 

Que deviendront ces fréquences dans les générations à venir? et à 
l'infini? 

b) Les très nombreux croisements effectués entre plantes à fleurs blan- 
ches des deux populations donnent toujours des descendants à fleurs 
rouges. Qu'en déduisez-vous ? 

Quelles sont les proportions des allèles, des génotypes et des phénotypes 
chez les plantes de la génération 0 de la population U? La loi de Hardy- 
Weinberg s’applique-t-elle ? Pourquoi? 

Quelles sont les proportions des différents génotypes dans les gamètes 
issus de la génération 0 de la population U? 

Quelles sont les proportions des allèles, des génotypes et des phénotypes 
chez les plantes de la génération 1 de la population U? 

Que deviendront ces fréquences dans les générations à venir? et à 
l'infini? 


Corrigé 


I Les autofécondations de plantes [R] peuvent donner des plantes [B]. On 
peut done soupçonner que [R] est dominant sur [B]. Ceci est confirmé par 
les proportions 3/4, 1/4 obtenues en autofécondation. Un locus R/r déter- 
minerait alors la couleur, avec RR et Rr déterminant le phénotype [R] et rr 
la couleur [B]. Ceci est confirmé par le fait que les croisements entre 
plantes [B] donnent toujours [B]. Le croisement de plantes Rr par une plante 
rr doit donner 1/2 [R] et 1/2 [B]. En croisement avec une autre plante [R], 
cette plante donnera soit uniquement des descendants [R] (si l'autre plante 
est RR) soit 3/4 [R] et 1/4 [B] (si l'autre plante est Rr). 

IL 1) Ces deux populations sont panmictiques, on va donc trouver les 
proportions suivantes : 


Population V : p? RR, 2 p,a, Rr et qi? rr 
soit p? + 2 pa, [R] et q,° [B] 

Population W : Pu? RR, 2 pau Rr et qu? rr 
soit Pa? + 2 Pudu [R] et qu? [B] 


2) a) Le croisement entre deux génotypes homozygotes récessifs (test de 
complémentation) permet de savoir, dans ce cas, que les gènes déterminant 
la couleur de la fleur dans les deux populations sont situés au même locus. 


Le mélange en proportions égales des deux populations produit des pro- 
portions alléliques qui vont simplement être les moyennes des proportions 
précédentes : 


Pu = 5(PotPuw) À Qu = (ut Au) 


Puisque ce sont des graines qui sont mélangées, les plantes qui en sont 
issues vont refléter les proportions de ces graines et les proportions des 
génotypes seront les moyennes de ces proportions. On trouvera donc, dans 
U, les génotypes dans les proportions : 
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1 1? 
ge +po)RR, Ho =(pa+Paqu)Rr et Zau +qurr 
soit, pour les phénotypes : 
1 1 
5 +2p,q+Pu+2PuuR] et z(a» +qu)[B] 
Les proportions de Hardy-Weinberg sont : 
p? RR, 2p,a, Rr et qu rr 


soit une proportion d’hétérozygotes de : 


He 


1 1 
2Pydu = 25(Pu + Pu)5(Qv + Au) 
1 
= 5 (Po + Puau + Pogu + Pudu) 


La différence entre la proportion d'hétérozygotes trouvée dans U (Ho) et 
celle qui serait attendue selon Hardy-Weinberg (He) est : 


1 
He -Ho = FPA + Puau + Pau + Pwdo) — Pod — Pulw 


1 
ZO Po Pudu + Po + Puao) 
= Tip dy + qu) + Palau du) = ZP- Pudu- 4) 
Remarquons que qw -qs = (1-pu)-(1-p,) = (Ps-Pu) 
d'où He-Ho = 3P,- Pu)” 


Cette valeur est positive tant que p,- p, n’est pas nul, elle est nulle si 
Py — Pw = 0. En d’autres termes, si deux populations panmictiques sont 
différenciées, le mélange d'individus provenant de ces deux populations ne 
se comporte pas de façon panmictique. Cet effet est appelé effet 
Wahlund. La non-panmixie sur l'ensemble vient du fait que les croisements 
ne se font pas au hasard sur l’ensemble mais seulement au sein de chaque 
groupe. Si les deux groupes sont différents, ces croisements endogames ont 
pour conséquence que les individus qui se rencontrent se ressemblent plus 
que si les croisements se faisaient au hasard et donc que la proportion 
d’hétérozygotes est toujours inférieure à celle qu'on attendrait en panmixie. 


Il n’y a pas de pression évolutive, de ce fait les proportions dans U restent 
inchangées pour la suite des générations : 


St 1 
Pu = ZP+ Pu) et qu = 3l + Qu) 
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Ceci est vrai dans les gamètes et dans les plantes qui en seront issues. 


La population U suit toutes les hypothèses de Hardy-Weinberg. Les pro- 
portions seront donc, dès la première génération, chez les graines et les indi- 
vidus qui en seront issus : 


p° RR, 2p,q, RR et qd 


b) Le test de complémentation est positif : les croisements entre génotypes 
homozygotes récessifs produisent le phénotype dominant. On peut donc en 
déduire que deux loci sont impliqués. On peut également en déduire que 
chacune des populations possède, à l'état fixé, l’allèle dominant correspon- 
dant à la couleur dans l’autre population. Les plantes de type [B] de la popu- 
lation V ont donc pour génotype rir RoR, tandis que celles de la population 
W ont pour génotype RR; roro. L'allèle R, a donc la proportion p, dans V et 
1 dans W, réciproquement, l’allèle R; est en proportion 1 dans Vet p„ dans W. 


La génération 0 de la population U aura alors les proportions suivantes : 


Pour les allèles : 5a + P,)R1 et ja ri, 


de même, la -Pu)Bp et Zau T2. 


Pour les génotypes, la moitié des graines de la population U vient de la 
population V, soit : 


RR; Ro : ip? 

Riri RR2:p,q 

rırı RoR2 : ja 

L'autre moitié vient de la population W, soit : 
RıRı Roi : ipt 

RiR; Raro : Pu Qu 

RiRi roro : TH 

Au total, ceci donne : 

RR; R2R3 : io + pa) 

Rirs RoR? : Po Qu 


1 
rırı RoRo : 54 
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RiRi Rare : Pu qw 
RiRi roro : ia 
soit, pour les phénotypes : 
BE? +p? + 2pua, + 2puqu) [R] et Za? +a?) [B] 


ce qui, remarquons-le, est similaire à ce qu’on avait trouvé en a). 


kci encore, la loi de Hardy-Weinberg ne s'applique pas puisque, pour cha- 
cun des deux loci, on a mélangé des génotypes provenant de populations 
différenciées (sauf dans le cas trivial où p, = p„ = 1). 


La génération 0 produira 3 types de gamètes dont les génotypes et leurs 
proportions sont donnés ci-dessous. 


1 1 
RıR2 : 3 (Pa + Pu + Pudo + Pugu) = 5(Po + Pu), 
1 1 
Rir2 : 5(aw + Puu) = 7 du 
1 1 
r1Ro : 50de + PQ) = 5% 


L'association de ces gamètes ne changera pas les proportions alléliques 


(pas de pression évolutive) qui vont rester égales à 3a +p,)R,et Jar: . De 
même, pour le locus Rp, on aura ju +pu)Ro et Dur 


À la génération 1, les génotypes seront constitués par l'association au 
hasard des gamètes ci-dessus, soit (il peut être utile de construire le tableau 
pour ne pas oublier de compter deux fois les croisements qui se font dans les 
deux sens) : 


1 

RiR;R2R3 : a Pr +Pu) 
1 

RiRiRore : ZAu(Po + Pu) 
1 

RiriRoko : 5 do(Pu + Pu) 
1 

RiriRoro : 7 du 


1 
RiR;rors : aa 
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1 2 
ru R2R2 : Ja 


Seuls les deux derniers génotypes ci-dessus donnent le phénotype [B] et 
les proportions des phénotypes sont donc : 


1 
AP + Pu) + 2(qu + Qu)(Pe + Pu) + 2a,a41 de type [R] 
d:2 V2 
4 (Qu + Au) de type [B]. 
Dans les générations à venir, si les loci portant les allèles R;/r; et R2/r2 
ne sont pas totalement liés, le déséquilibre de liaison va disparaître sous 
l’action de la recombinaison et de la panmixie et on tendra, à l'infini, vers 


une situation d'indépendance statistique des deux loci avec les proportions 
suivantes dans les gamètes : 


RR: ła +p,X(1+pu) 
R 1 
12 : 42001 + p,) 
1 
r1Ro A aa 0 + Pu) 


1 
riro: gaw: 


Date de floraison 


I Chez une espèce végétale allogame annuelle, l'étude de la date de flo- 
raison a montré qu'il existait deux types d'individus ne fleurissant pas au 
même moment; ces deux types de plantes sont rigoureusement identiques 
pour toutes leurs autres caractéristiques. Cette espèce peut pousser dans 
deux milieux : au soleil ou à ombre, ce qui modifie également la date de 
floraison. Les deux types de plantes seront notés [1] et [2] respectivement. 
Les dates de floraison sont données dans le tableau suivant. 

En 1989, on a croisé une plante de type [1] et une plante de type [2]. En 
1990, les graines issues de ce croisement ont été semées dans chacun des 
deux milieux et ont montré les caractéristiques données dans le tableau 
(ligne [1] x [2}). Dans chacun des deux milieux, on a laissé les plantes issues 
de ce croisement se féconder librement entre elles (chacune des deux popu- 
lations étant totalement isolée) pour produire la floraison F2. Les généra- 
tions suivantes seront également constituées par le semis des graines dans le 
milieu où se trouvait leur mère. Chaque milieu contient 4000 plantes. En 
F2, on a dénombré les plantes fleurissant à chaque date. Tous ces résultats 
sont donnés dans le tableau. 


1) Quel déterminisme pouvez-vous proposer pour la date de floraison 
dans cette espèce? 

2) Quels sont les effectifs espérés des différents génotypes parmi les 
plantes fleurissant en 1991 aux différentes dates dans les deux populations”? 

3) Les fréquences génotypiques vont-elles changer? Sous l’action de 
quel type de processus? Mêmes questions pour les fréquences alléliques. 
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4) Nous allons nous intéresser à la population se trouvant au soleil. 

a) Quelles sont les proportions des allèles (p; et q; = 1 - pı) dans le pol- 
len au 1% juin 1991? 

b) Quelles sont, en fonction de pı et qı, les proportions des différents 
génotypes dans les graines produites par les plantes fleurissant au 
1er juin 1991? 

c) Quelles seront, en fonction de p; et qı, les proportions pz et qz des 
allèles parmi les plantes fleurissant au 1% juin 1992? 

d) Comment va évoluer la population? Une réponse qualitative est 
suffisante. On peut aussi calculer q, en fonction de q, _1 puis de qı en 
utilisant la suite des inverses (1/q,). À l'équilibre, quels seraient les effec- 
tifs de plantes fleurissant aux différentes dates dans la population se trou- 
vant au soleil ? 

5) Que va-t-il se passer dans la population se trouvant à Fombre? 


Il Si les deux populations (soleil et ombre), au lieu d'être isolées, étaient 
proches (en lisière de forêt par exemple) et pouvaient librement échanger du 
pollen, que se passerait-il? Pour répondre à cette question, aucun calcul 
n’est nécessaire. Il est utile de montrer que, même si les flux polliniques 
sont symétriques entre les deux populations, ces flux ne le sont pas du 
point de vue des allèles et d'en déduire que les alièles peuvent être piégés 
dans certains milieux. Quel serait l’état d'équilibre des dates de floraison 
dans les deux milieux? Les deux populations finales sont-elles différenciées? 
isolées? Ce processus vous semble-t-il de nature « adaptative »? 


Milieu 
Type Fe =, =. 
Soleil Ombre 
[1] 1 juin 15 juin 
{2] 15 juin 30 juin 
[1] x [2] 1% juin 15 juin 
(1990) 3000 : 1° juin 3000 : 15 juin 
F2 ENR ua 
(1991) 1000 : 15 juin 1000 : 30 juin 


Dates de floraison en fonction du type de plantes, ou du croisement. En deuxième 
génération (F2), les deux types de plantes sont en mélange, les chiffres donnent les 
effectifs de ces deux types sur un total de 4000 dans chaque environnement. 


Corrigé 


I 1) La date de floraison est déterminée conjointement par le génotype 
et le milieu. Dans chaque milieu, les résultats montrent que la différence 
entre les deux types de plantes peut être due à l'action d'un locus possédant 
deux allèles. L'allèle A, dominant, détermine la forme précoce [1], l’allèle 
récessif a, détermine la forme tardive [2]. 


2) 

Soleil, 1° juin : 1000 AA, 2000 Aa 
Soleil, 15 juin : 1000 aa 

Ombre, 15 juin : 1000 AA, 2000 Aa 
Ombre, 30 juin : 1000 aa 


3) Il y a homogamie, le nombre de descendants des différents génotypes 
n'est pas différent. Les fréquences génotypiques vont donc changer sous 
l’action de ce régime de reproduction, les fréquences alléliques ne doivent 
pas changer. 


4) a) allèle À : p; = 


allèle a : q} = 


b) Les graines sont produites en panmixie parmi les plantes se reprodui- 
sant en même temps dans chaque population. Les proportions sont donc : 


AA : p’, Aa : 2p1q1, aa : qi? 
c) Au 1® juin, fleurissent les génotypes suivants : 
AA: p/p? + 2p1q1) = pi/l a q^ 
Aa : 2 piq1/(p1" + 2p1q5) = 2p1q1/1 - qi) 
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Les proportions des allèles seront donc : 
A : Po = (p1? + pa — q1?) = p1/(1 -qô 
a : q2 = pqi/Ul -q^ 


d) Les allèles a vont disparaître du groupe de plantes fleurissant le 
1er juin. La population sera alors entièrement composée de plantes AA 
fleurissant le 1% juin et de plantes aa fleurissant le 15. Les proportions des 
allèles ne changeant pas, il y aura 2000 plantes de chaque type. 


De même qu’on a calculé q, on peut calculer q, : 
An = Pn-1 An-1/U = Qn-17 
ce qui se simplifie en remarquant que : 
-q19= (1-41) (1 +q,-1) et que (1 -qn-1) = p,-1 
soit An = An-1/U +4,_1) 
ce qui donne 1/q,=1+1/q,_,=(n-1)+1/q;, 


On voit que quand n croît, 1/q, augmente, ce qui signifie que q, tend 
vers zéro. L'allèle a disparaît donc du groupe des plantes fleurissant au 
1% juin. Bien sûr, il ne disparaît pas de la population, il se retrouve dans le 
groupe des plantes fleurissant au 15 juin qui augmente en effectif. 


5) Dans la population se trouvant à l’ombre, le même processus va 
entraîner la séparation des deux génotypes AA et aa (2 000 plantes chacun 
à l'équilibre) fleurissant respectivement au 15 et au 30 juin. 


II Le résultat des échanges de gènes est schématisé ci-après. Les deux 
populations échangent des gènes le 15 juin mais seuls les gènes a migrent 
du milieu ensoleillé au milieu ombré tandis que l’allèle A ne migre que du 
milieu ombré au milieu ensoleillé. Sur l’ensemble, il n’y a aucune sélection. 
Les proportions globales des allèles À et a ne changent pas à l'échelle de 
l'ensemble des deux populations. En revanche, leur distribution change. Les 
allèles À sont « piégés » dans le milieu ensoleillé tandis que les allèles a sont 
« piégés », quand ils sont à l'état homozygote (au fur et à mesure que les 
gènes À partent, ceci est de plus en plus fréquent), dans le milieu ombré. Le 
résultat final est une divergence totale des deux populations, la population 
au soleil ayant fixé l’allèle A et la population à l'ombre ayant fixé l’allèle a. 
Les deux populations sont alors différentes pour des raisons environnemen- 
tales et génétiques et fleurissent à des périodes radicalement différentes, ce 
qui crée un isolement total. Cet isolement est une conséquence de la 
« mécanique » génétique des populations et, quelles qu'en soient les consé- 
quences, est issu d'un processus qui n'a rien d’adaptatif (l'histoire ne dit pas 
s’il est « bon » de fleurir plus ou moins tard dans chacun des milieux). 
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Soleil Ombre 
1% juin AA + Aa 
T 
À a 
4 
15 juin aa Aa AA + Aa 
a 
l 
30 juin aa 


Dates de floraison et flux de gènes entre les deux populations. 


Trois allèles 


Dans une population infinie et isolée de plantes hermaphrodites annuel- 
les coexistent, en un locus À, trois allèles A4, À, et A; en fréquences respec- 
tives p, q et r. On supposera que ces trois allèles sont neutres. 


1) Supposons que la population est panmictique. 

a) Quelles proportions des différents génotypes peut-on attendre parmi 
les individus de cette population? 

b) Toujours si la population est panmictique, quels génotypes peut-on 
attendre, et en quelles proportions, dans la descendance d'une plante de 
génotype AA, ? et d’une plante de génotype 4,43? 


2) Supposons maintenant que chaque plante de la population produit une 
fraction t de ses graines en panmixie et une fraction (1 -— t) en autogamie. 


a) Dans ce cas, quels génotypes peut-on attendre, et en quelles propor- 
tions, dans la descendance d’une plante de génotype AA; ? et d’une plante 
de génotype A2A3? 

b) Soit H, la proportion du génotype A,A: à la génération n dans la 
population. Combien vaut H, en fonction de p, q, t et H,_,? Quelle est la 
limite de H, quand n croît? (On pourra utilement exprimer le résultat en 
utilisant le paramètre F.) 

c) En déduire les proportions d'équilibre des trois génotypes hétérozygo- 
tes, puis celles des trois génotypes homozygotes (on se souviendra que les 
proportions des allèles A4, À, et Arestent respectivement p, q et r). 
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3) Ce locus détermine la couleur de la fleur : À; donne une couleur vio- 
lette, À, une couleur jaune et A; une couleur blanche. Les relations de domi- 
nance sont les suivantes : À, > A; > A3. 

a) Quelles couleurs de fleurs peut-on obtenir dans la descendance par 
autofécondation d’une plante à fleurs violettes? à fleurs jaunes? à fleurs 
blanches? 

b) Quelles sont, en fonction de p, q et r, les proportions des trois phéno- 
types si la population est panmictique ? 

c) Quel serait l'effet d’une augmentation de la proportion d’autogamie 
sur les proportions de ces phénotypes? 

N.B. Les questions 2 et 3 sont largement indépendantes. 


Corrigé 


AA: AÁ? AA3 A2A2 A2A3 A3 


1)a) p? 2pq 2pr q? 2qr r 
b) p q r 0 0 0 
0 p/2 p/2 g/2  (q+r)/2 r/2 
2)a)l-t+tp tq tr 0 0 0 
0 tp/2 tp/2 tg/2+ (1-tp}/2 tr/2+ 
(1-1)/4 (1 -t)/4 


b) H, = t 2pq +(1-t)H,_/2. 
Quand n croît, H, tend vers H tel que H = t 2pq + (1 - t) H/2 soit 
H = 2pq 2t/(1 + t), c’est-à-dire H = 2pq(1 - F) avec F = (1-t)/(1 +t). 
Aâ; AA? A13 A2A2 A2Â3 AsÂ3 


c) p?  2pqli-F 2pli-F @ 20-A À 
+ Fpa +r) + Falp +r) + Fr(p + q) 


En effet, cherchons la proportion de AA, à l’équilibre; soit X cette 
valeur, nous savons que p =X +pq(l-F) + pril-F), proportion de 
l’allèle A4. On en déduit que X = p? + Fp(a +r). 


3) a) Violettes : les trois. Jaunes : jaunes ou blanches. Blanches : blan- 
ches uniquement. 
b)  Violettes : p? + 2pq + 2pr 
Jaunes : q? + 2qr 


Blanches : r 
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c) La proportion du phénotype violet, exprimé par tout individu 
possédant un allèle A4, va diminuer avec la diminution d'hétérozygotie. 
Celle du phénotype blanc, double récessif, ne peut qu'augmenter avec 
l'homozygotie. 


La proportion du phénotype jaune évoluera dans une direction ou l'autre 
en fonction des proportions des différents allèles. En effet, elle augmente 
quand un allèle A, (jaune) n'est plus masqué par un À, (violet dominant), ce 
qui arrive souvent quand p est grand mais elle diminue quand un AA; (jaune 
du fait de la dominance de À, sur A3) est détruit, ce qui arrive souvent quand 
r est grand. Au total, la proportion du phénotype jaune doit augmenter s’il 
y a beaucoup de violet et diminuer s’il y a beaucoup de blanc. 


Démonstration formelle 

Le phénotype violet a pour proportion : 

p? + Fpa + r) + 2pq(1 -P) + 2pr(1 - F) = p° + 2pq + 2pr - F{pq + pr) 

valeur qui décroît quand F croît. 

Le phénotype blanc a pour proportion : 

r2 + Fr(p + q) 

valeur qui augmente quand F croît. 

Le phénotype jaune a pour proportion : 

q? + Falp + r) + 2qr(1 - F) = g? + 2qr + Fap - r) 

valeur qui augmente quand F croît si p > r et qui diminue quand F croît si 
r>p. 


La cyanogénèse du trèfle 


Chez le trèfle blanc (Trifolium repens), qui est une espèce allogame, on 
a repéré l'existence de deux formes de plantes. Certaines produisent du cya- 
nure quand on écrase les feuilles (forme cyanogénique), d’autres non (forme 
acyanogénique). Le cyanure (HCN) est produit par la dégradation d’un glu- 
coside (Ac) par une enzyme (Li). Les deux produits Ac et Li restent dans des 
compartiments différents de telle façon que la réaction ne se produit que 
lorsque la feuille est endommagée. 

On a constaté qu’on pouvait différencier quatre types de plantes. Les 
plantes de type T4 produisent du cyanure. Les plantes de type T1, T2 et T3 
ne produisent pas de cyanure mais lorsqu'on écrase ensemble des feuilles 
T2 et T3, on obtient un dégagement de cyanure (alors que les mélanges 
T1 + T2 et T1 + T3 ne donnent pas de cyanure). 


Les croisements (F1) effectués entre des plantes prélevées dans la nature 
donnent les résultats suivants. 


T1xT11-T1 


T1 x T2 > T2 où iTi +372 


T1 x T3 > T3 ou 5114578, 


T2 x T2 > T2 ou kr1 +572 
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T3 x T3 > T3 où 1ri+9rs, 


TA x TA > T4 ou TA + T3 ou T4 + T2 ou T4 + T3 + T2 + T1 
T2 x T4 = TA où T4 + T3 ou T4 + T2 où T4 + T3 + T2 + T1 
T3 x TA > TA où T4 + T3 ou T4 + T2 ou T4 + T3 + T2 + TI 
T1 x TA = T4 ou T4 + T3 ou T4 + T2 ou T4 + T3 + T2 + T1 
T2 x T3 = TA ou T4 + T3 ou T4 + T2 ou T4 + T3 + T2 + T1 


I Montrer que ces résultats peuvent s'expliquer en faisant intervenir deux 
loci comportant chacun deux allèles. On appellera ces couples d’allèles res- 
pectivement A/a et L/! et on supposera que ces deux loci se comportent 
indépendamment l'un de l’autre. En déduire les proportions attendues dans 
les deux derniers croisements ci-dessus. 

Comment les résultats auraient-ils été modifiés si le trèfle avait été une 
espèce strictement autogame dans la nature (comme les pois de Mendel)? 


IE Soient, pour une population donnée, supposée panmictique pour ce 
caractère, p et qı (=1 - p;) les proportions respectives de A et a et pz et 
qz (=1 - po) les proportions respectives de L et l. 

1) Admettons qu'il n'y a pas de déséquilibre de liaison entre ces deux loci. 


a) Quels types de plantes, et en quelles proportions, attendriez-vous 
dans des graines prélevées dans cette population sur des plantes mères de 
type T1? 

b) Même question si, avant de prélever les graines, on autoféconde 
une fraction s des fleurs de la plante concernée. 


c) Quelles sont, en fonction de p;, qı, P2 et qz, les proportions 
respectives des formes T1, T2, T3 et T4 dans la population. 


d) Dans une population, on a trouvé les effectifs suivants : 
T1:44 T2:46 T3:116 TA:154 


Pouvez-vous, en supposant la panmixie, estimer les valeurs de pı et p2? 
L'hypothèse d'indépendance statistique (absence de déséquilibre de liaison) 
des deux loci vous paraît-elle acceptable (un x? à 1 degré de liberté a 95 % 
de chances d'être compris entre O et 3,84)? 


2) Admettons maintenant qu’il y a un déséquilibre de liaison de valeur D. 
Quelle serait, en fonction de pı, q1, P2, q2 et D, la proportion des formes 
T1, T2 et T3 dans la population? 


III Le cyanure est un poison au goût assez fort {odeur d'amande amère). 
Pouvez-vous proposer une hypothèse concernant les raisons évolutives 
conduisant les plantes à produire les produits Ac et Li? Une étude à l'échelle 
de l'Europe (publiée en 1941) a montré la répartition suivante des plantes 
cyanogéniques et acyanogéniques. L'auteur a superposé les courbes des 
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isothermes de janvier. Pouvez-vous, en utilisant entre autres vos connaissan- 
ces sur les facteurs qui peuvent expliquer l'existence d’un cline, proposer 
une (ou des) hypothèse(s) concernant la distribution de ce polymorphisme ? 


or 


Répartition des formes cyanogéniques (en noir) et acyanogéniques 
(en blanc). Les isothermes de janvier ont été ajoutées sur la carte. 
{D'après DADAY, H., 1954. Gene frequencies in wild populations of 
Trifolium repens. I. Distribution by latitude. Heredity, 8, p. 65-66.) 


Corrigé 


I Les croisements incluant T1 et T2 peuvent s'expliquer avec un locus à 
deux allèles À et a avec À, dominant sur a, déterminant le type T2. De 
même pour ceux incluant T1 et T3, on peut supposer un locus avec deux 
allèles, L et I où L, dominant, détermine T3. Le fait qu’en écrasant ensem- 
ble T2 et T3, on obtient du cyanure laisse penser que l’un (disons T2) 
produit le glucoside (et pas l’enzyme) et l’autre (T3) produit enzyme (et pas 
le glucoside). L'apparition de T4 dans la descendance de T2 x T3 est un 
phénomène de complémentation. T1 correspond au génotype aa ll, T2 au 
génotype A* Il, T3 au génotype aa L* et T4 au génotype A* L* (* est mis 
quand l’allèle présent est indéterminé). 


T1 x T4 = TA s'obtient si le parent T4 a pour génotype AA LL 
1 1 


T1 x T4 = 5T4+5T3 " Aa LL 

TIxT4 > 574 +372 " AA LI 

T1xT4 > İT4+ÍT3+İT2+1T1 " Aa LI 
1 ra ta" 

T2 x T3 > T4 parent T2 AA Ïl et parent T3 aa LL 

T2 x T3 > 5T4+3T3 "Aall "aa LL 

T2 xT3 > ira+ir2 "AA Il "aa LI 


1 1 1 1 a n 
T2 x T3 > 314+318+372+371 Aa ll aa LI 
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Si le trèfle était autogame, il n'y aurait pas d’hétérozygotes. Les croise- 
ments auraient donné des résultats toujours homogènes : 


T1 x T1 = T1, TLXT2- T2, T1 x T3 > T3, T2 x T2 > T2, 
T3 x T3 > T3, T4 x T4 > T4, T2 x T4 = TA, T3 x T4 = TA, 
T1 x T4 > T4, T2 x T3 > T4 


II Soient, pour une population donnée, supposée panmictique pour ce 
caractère, p, et q; (=1 — pı) les proportions respectives de A et a et pz et 
q2 (=1 - po) les proportions respectives de L et I. 


1) a) Dans des graines prélevées sur des individus de type T1, on devrait 
trouver : 


des descendants aa 1I (T1) en proportion (1 -p,N{1 - p2), 

des plantes Aa lI (T2) en proportion p(1 — po), 

des plantes aa LI (T3) en proportion (1 - p;)p2, 

et des plantes Aa LI (T4) en proportion pip2. 

b) L’autofécondation produit uniquement des génotypes aa Il. De ce fait, 
la plante produira des graines se répartissant de la façon suivante : 

aa Il (T1) en proportion s + (1-s)\(1 - p}{1 - po), 

Aa ll (T2) en proportion (1 - s)p1(1 — po), 

aa LI (T3) en proportion (1 - sì(1 - pipe. 

Aa LI (T4) en proportion (1 - s)p1P». 

c) Les proportions respectives des formes T1, T2, T3 et T4 dans la 
population sont données par le tableau suivant. 


| LL + Lip + 2 pro | a? 


AA+A p?+2pa| T4 (pi; + 2pa) | T2 (p1? + 2p1q1)0? 
(p2° + 2p292) 


aa q? T3 qp? + 2p2q2) | T1 qa 


d) Dans une population, on a trouvé les effectifs suivants : 
T1:44 T2:46 T3:116 T4:154 
q? = (116 + 44)/360 = 4/9 = p; = 1/3, qı = 2/3 
q2 = (44 + 46)/360 = 1/4 = p; = q2 = 1/2 
Si les deux loci sont indépendants, les proportions espérées dans chaque 
case du tableau sont données par le produit de la probabilité de se trouver 
dans la ligne considérée par la probabilité de se trouver dans la colonne 


considérée. L’effectif espéré s'obtient en multipliant la probabilité par 
l'effectif total. 
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Ti:40 T2:50 T3:120 T4 :150 


d’où un x? de 4? (1/40 + 1/50 + 1/120 + 1/150) = 0,96 ce qui est loin 
en dessous de la valeur 3,84. L'hypothèse d'indépendance statistique 
(absence de déséquilibre de liaison) peut donc être conservée. 

2) Les proportions des génotypes sont alors données par le tableau 
suivant. 


AL pipo + D| Al pig» -D | aL qyps - D | al q1q2 + D 
T4 T4 
T4 T2 
T3 


T1 


AL pipe + D 
Al p1q2 - D 


On voit que les proportions des différents types sont : 
T1 : (q1q2 + D}? 

T2 : (p142 - DŸ + 2 (pige — D) (a102 + D) 

T3 : (Po — D}? + 2 (qıP2 — D) (qd + D) 


III Le cyanure est un poison au goût assez fort qui n’est pas produit tant 
que la feuille n'est pas endommagée. Il est donc probable que sa production 
serve à diminuer la prédation par les herbivores. On sait, en particulier, que 
les gastéropodes (escargots, limaces) peuvent être repoussés par certains 
composés produits par les plantes. Cependant, le cyanure pourrait, en fait, 
empoisonner la plante elle-même, ce qui l'oblige à garder le glucoside et 
l'enzyme dans des compartiments différents. 


La répartition observée à l'échelle de l'Europe montre un cline très net. 
Ce cline est difficile à expliquer. En effet, il semble que le froid hivernal joue 
un rôle dans la détermination des proportions observées. Ce rôle peut être 
de rendre les herbivores moins nombreux, ou moins efficaces ou, dans un 
autre ordre d'idées, de tuer plus facilement les plantes cyanogéniques (on 
pourrait penser qu’elles s’empoisonnent du fait d’une moins bonne étan- 
chéité des compartiments). Cependant, ce type de mécanisme devrait a 
priori aboutir à de larges zones homogènes séparées par un cline beaucoup 
plus restreint dû à la migration. Il semble, en effet, inenvisageable que le 
trèfle migre à chaque génération sur des distances de l’ordre du millier de 
kilomètres. Il faut alors imaginer qu’en chaque point, la sélection détermine 
une proportion d'équilibre fonction de la température, sans que la migration 
joue un rôle important dans ce cline. 
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Chapitre A 


Exercice A.1.1 
1) (AA) = p, f(aa) = q 
2) f(Aa) = 2q, (AA) = 1-2q 
3) f(Aa) = 2p, f(aa) = 1-2p 


Exercice A.1.2 
f(A:) = 0,88, f(A2) = 0,12, f(B1) = 0,84, f(B;) = 0,02, f(B3) = 0,14 


Exercice A.1.3 


1) Un seul allèle est présent chez les mâles, leur génotype est X,Y (phé- 
notype roux) ou X,Y (« non roux »). Les femelles sont de génotypes XX, 
(rousses), X_X, (« écaille de tortue »), ou X,X, (« non rousses »). 

2F, +F, M, _2F+F+M, 
2) F0) = 2F ’ fn(O) =M’ f0) = —3F;M_ 


Exercice A.2.1 


1) Un locus biallélique contrôle la couleur, R, allèle dominant (rouge), b, 
allèle récessif (blanc). 
a) 1/2 de plantes à fleurs blanches, 1/2 à fleurs rouges. 


b) Si la plante à fleurs rouges est homozygote, 100 % de plantes à fleurs 
rouges, si elle est hétérozygote, 3/4 de plantes à fleurs rouges, 1/4 de plan- 
tes à fleurs blanches. 


2) f(b) = 0,4, AR) = 0,6. 192 hétérozygotes attendus. 
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3) Descendants d'une plante à fleurs blanches : 40 % d’homozygotes 
{phénotype fleurs blanches), 60 % d’hétérozygotes (rouges). Descendants 
d’une plante à fleurs rouges : 50 % d’hétérozygotes, 20 % d’homozygotes 
récessifs, 30 % d'homozygotes dominants, soit 80 % de plantes à fleurs 
rouges et 20 % de plantes à fleurs blanches. 


Exercice A.2.2 


Daphnies : f(A,) = 0,437 et f(A;) = 0,563, x? = 0,19, avec un degré 
de liberté. Le test est non significatif, on ne rejette pas l'hypothèse de panmixie. 

Coléoptère : f(B,) = 0,741 et f(B;) = 0,259, x = 41,85, avec un 
degré de liberté. Le test est très significatif, on rejette l'hypothèse de 
panmixie (on suppose qu'il s'agit d'un effet Wahlund). 


Exercice A.2.3 

En faisant l'hypothèse que la population se reproduit en panmixie, on a 
q = JEn = 0,6 soit p = 0,4. On ne peut pas tester cette hypothèse, car 
elle a servi pour calculer les fréquences alléliques et on a ainsi utilisé toute 
l'information disponible dans l'échantillon. Si on cherchait à calculer les 


effectifs théoriques, on retomberait exactement sur les effectifs observés : il 
ne reste aucun degré de liberté. 


Exercice A.2.4 
1I) ATTS) = p°, ATT) = a°, P) = r°, TT) 
(= 2)pq. f(T'#°)= 2pr, f(T) = 2qr 
2) fabyssin) = f(T T®) + (TT) + FT) = p? + 2pq + 2pr 
= p(p+2q+2r) = p(l+q+r) 
fltigré) = fCTT) + (TE?) = q° + 2ar = q(q + 2r) 
fimarbré) = f(t°#°) = r” 


3) r = 0,23, q = 0,55, p = 0,22 
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Exercice A.2.5 


1) I! faut faire l'hypothèse que la population est panmictique et qu'iln'ya 
pas de différence de viabilité des trois génotypes entre le stade zygote et la 
naissance. L'existence de mutation et de sélection après la naissance (gène 
sublétal) n’invalide pas le calcul. Les personnes touchées par la maladie sont 
en fréquence q? = 0,0004. La fréquence de l'allèle muté est donc de 2 % 
environ. La fréquence attendue de personnes porteuses est de 2pq 0,04 
= 4 % soit une personne sur 25. i 


2) Proportions d'allèles mutés chez les porteurs : pq 5=P= 98 %, 
pqa+q 
2 
chez les personnes atteintes : q 5=q= 2%. 
pqąa+q 


Exercice A.2.6 
1)G:=p;=1,p, = 0, p = 2/3 
G: = p = 1/2, Pm = 1, p = 2/3 
Gz: = pi = 3/4, Pm = 1/2, p = 2/3 


2) pain) = pn- 1), p(n) = 1/2[pn-1)+Pm(n- 1) 
p(n) = 1/3[2p;(n) + Pm(n)] 
= 1/3p{n-1)+Pm(n-1)+p;(n-1)= p(n-1) 
E, = - 1/2[pa(n- 1)- p(n- 1) = (-1/2)E, 3 = (- 1/2)"E) 


3) Équilibre : Pi = Pm = 2/3,p = 2/3 


Exercice A.2.7 


1) La fréquence de l’allèle est égale à la fréquence des garçons daltoniens 
soit q = 8,01 %. En supposant que la population est panmictique, on attend 
une fréquence égale à g? de filles daltoniennes soit 0,642 %. 

2) Sur 9072 filles on attend donc 58 filles daltoniennes. Elles sont moins 
nombreuses que prévu. Il semble en fait que plusieurs gènes interviennent 
dans l’anomalie. 
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Exercice A.3.1 
2) N > 384 


Exercice A.3.2 
1) D, = (Do+1/2H0) H, = 2Do+1/2H5)(Ro + 1/2Ho) 
R, = (Ro+1/2H0) 
2) D, = D,1+1/4H,1 H=1/2H,4 R,=R,1t1/4H,.: 


À l'équilibre D, = Dọ+1/2Họ =p, H=0, R, =q 


E 1-t À =; Atpq p _ l-t 
3)H„ = 2tpq + 5 H,,_1, équilibre pour : H, = irt EF, = EF 
Exercice A.3.3 
= D 
ST 41 = 1-2y+4x 


Exercice A.3.4 

1) Allogamie obligatoire, 100 % d’hétérozygotes; ce locus induit l'alloga- 
mie, ce qui favorise la panmixie pour les autres loci. 

2) Trois allèles au minimum, trois génotypes 1, 2, 3. 


fQ) = 1/2f(2) + 1/2f(3) = 1/2[1-f(1)}, f = 1/3 


3) Grand nombre d’allèles. 


Exercice A.3.5 


1) Un locus : allèle A, dominant, forme précoce (1), allèle a, récessif, 
forme tardive (2). 

2) Croisement F2 : 1/4 AA, 1/2 Aa, 1/4 aa soit 3/4 de précoces et 
1/4 de tardifs dans chaque milieu. 

3) Absence de pressions évolutives : fréquences alléliques constantes. 

Régime de reproduction (ici, homogamie) : modification des fréquences 
génotypiques. 

4) pı = 1-q; = 2/3 
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-f(AA) = p}?, f(Aa) = 2p1q3, aa) = qi 


2 
P1+P19: 1 qi 
pi+2pidi 1+q: 1+q; 
soit Ara 1 PE NEE E SEA 
dn dn-1 qı 


Si n est grand, q tend vers 0 : il ne restera que des génotypes précoces 
AA parmi les plantes fleurissant le 1° juin et uniquement des aa parmi celles 


du 15 juin. 
5) Même phénomène à l'ombre. 


6) Allèles A « piégés » dans le milieu ensoleillé, allèles a « piégés » dans le 
milieu à l'ombre : à terme génotypes AA au soleil et aa à l'ombre exclusive- 


ment. 
Exercice A.3.6 
1 1 1 1 
Das = & 164 fo = FE = 


Exercice A.3.7 
NL STS 
fe Gus gtghe gt a(st ah) à cris 0 
Après n générations : 
_1 1 o1 (iy 
fa= 5t3fr-1> 1-f, = gU-fn-1) = (3) (- fo) 


sf,=1-(5) sf = 0 


Exercice A.3.8 


fa = LA +fn-2) + Gfn-1 
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Exercice A.3.9 


Entre Œdipe et Jocaste, il y a trois chaînes de parenté : par X (neuf 
maillons), par Y (neuf maillons) et O-J (un maillon). Le coefficient de consan- 
guinité d'Antigone vaut donc 0,252. 

Entre Antigone et Créon, il y a six chaînes de parentés. Une par X (dix 
maillons), une par Y (dix maillons), deux par Z (A-O-J-Z-C, quatre maillons, 
A-J-Z-C, trois maillons), et deux par T (trois et quatre maillons). Leur coeffi- 
cient de parenté vaut donc 0,188. 


Exercice A.4.1 


Si X est le nombre d'allèles A, PIX =k] = Chp"q" "avec N = 4 et 
pP =q = 1/2, pour k = 0, 1, 2, 3 ou 4, P = 6,25 %, 25 %, 37,5 %, 25 % 
ou 6,25 %. Le polymorphisme est conservé si k = 1, 2 ou 3, soit une pro- 
babilité de 87,5 %. 


Exercice A.4.2 


1) 206 heures, soit 8,6 jours. 
2) 6570 ans... 
3) a) La dérive va éliminer l’un ou l’autre. 


b) La dérive peut éliminer A ou a mais, si a est éliminé, la mutation va le 
réintroduire. Seul À peut être perdu; on va donc vers la fixation de a. 


Exercice A.4.3 


1) Un allèle est soit perdu soit fixé. 
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1 1\1 1Y 1 

2% (1-0 CR) à 

AX = g) = 1/N(1-1/N)"7 À, ECP(X) = N 

3) PO‘!1 
DEFINT A-Z : REM Initialisation————— 
DEFINT A-Z 
DIM r(1000), d(1000), a(1000), ad(1000) 
RANDOMIZE TIMER 
SCREEN 9 
gt = 40 : REM Nombre de générations 
n = 20 : REM Nombre d'individus 
lar = 580 : REM Largeur de l'écran 
hau = 200 : REM Hauteur de l'écran 
inter = lar / gt : REM Intervalle entre deux générations 


ind = hau / n : REM Intervalle entre deux individus 
FOR j = 1 TO n : a(j) = j : NEXT j : REM Numérotation des ancêtres 


FOR i = 1 TO gt : REM Les générations = 


FOR j = 1 TO n : REM Tirage du nombre de descendants de chaque repli- 
cateur 

r = INT(n * RND + 1) : REM Le replicateur r a un descendant; 

d(r) = d(r) + 1 : REM le nombre de descendants de r augmente donc d'1 
NEXT j 


FOR r = 1 TO n : REM Pour chaque replicateur : 

IF a(r) = 0 THEN 10 : REM s’il n’a pas de descendant, on l'oublie; 

FOR k = 1 TO dír) : REM sinon, on prend chaque descendant, 

de = de + 1 : REM, on le numérote, 

ad(de) = alr) : REM et on lui attribue le même ancêtre qu’à son parent. 

c= 1 + alr) - INT(15 * INT(a(r) / 15): REM On attribue une couleur à chacun 
LINE (i * inter, r * ind)-((i + 1) “inter, de * ind), c : REM On trace l'arbre 
NEXT k 

10 NEXT r 


de = 0 : REM et on prépare la génération suivante. 
FOR r = 1 TO n : d{r) = 0 : a(r) = adfr) : NEXT r 


NEXT i : REM fin 
END 
Exercice A.4.4 


L'effectif génétique est de sept individus. 
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Exercice A.4.5 


í WAP Wa uw 
p = —— = âp = pq ———— 
WAP +w,q WAP +w,q 


Il n’y a pas d'équilibre polymorphe possible. 


Exercice A.4.6 
, _ 3/4p+q «p _ a(d -5/4p) 
DP = 4 80 °P P = 374p 2q 
2) Oui : p, = 4/5 
Exercice A.4.7 


1) Un locus « couleur des pattes » : allèle blanc (B) dominant, allèle jaune réces- 
sif (), un locus « couleur du plumage » : allèle blanc (B) dominant, allèle roux (r) 
récessif. Souche A : au locus pattes génotype jj, au locus plumage génotype B?“ 
{¢ = allèle quelconque), avec l'hypothèse de panmixie: f(B1) = 1- f(r) 
1-71% = 0,9. Souche B: locus pattes, génotype B*, f(B) = 1-f(i) 
= 1-4/3% = 0,827, locus plumage, génotype rr. 

2) s = 74,4 % 

3) s’ = 77,5 %, soit 3 % de gain. 


Exercice A.4.8 


1) qo = 0,15, 30 % d’hétérozygotes, 70 % d’homozygotes. 
2 1 1 1 


+1=—+n 
avec qo = 0,15 et q, = 0,06, n = 10 (= 250 ans). 


An An. do 


Exercice A.4.9 
1) P;(n) = (1-mp)P;(n-1) +m;P;(n -1) 
P(n) = (1-m)P{n-1)+mP{n-1) 
2) Équilibre quand AP, = 0 (ou AP, = 0) soit P(n) = P(n). 


3) E, = (1-m;-m))"Eo, il faudra environ 23 générations. 
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Exercice A.4.10 


1) A) = 0,6, f(A:) = 0,4, x = 5,55 à comparer dans les tables à un 
x? à un degré de liberté soit 3,84 (à 5 %) ou 6,64 (à 1 %). L'hypothèse de 
la conformité à une structure de Hardy-Weinberg est rejetée. 


2) Lieu 1 : f(A,) = 0,785, (Az) = 0,215, x? = 0,02 
Lieu 2 : f(A1) = 0,415, f(A2) = 0,585, x? = 0,1. 


Hypothèses non rejetées. Le déficit correspond à un effet Wahlund. 


Exercice A.5.1 


Trois paramètres indépendants permettent de décrire tous les déséquili- 
bres gamétiques : 


D; = ga B,- Pa, PB, = 0,1044 
D: = SA,B, ` PA,PB, = -0,1596 
D3 = ga,n, -Pa;PB, = 0,0552 


Exercice A.5.2 


génotypes : A 5 ib soit : 


Génération Go : 


1o 


gamètes : A B a 


fréquence : p q 
On a donc D, = pq. 


Génération G; : 


fréquences : 


énotypes : ABAD: do 
genotypes: 45 ab ab 
p? 
A 


gamètes : B Ab aB ab 
fréquences :p-rpq rpq rpq q-rpq 


B(p) 
bia) | rpq | a-rpa | 


On a donc D, = (1 - r) pq. 


Génération G, issue de l'union au hasard des gamètes : 
AB Ab a B ab 
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en fréquences : pres pg-D, 1 pq-D,: g°+D, i 
Soit : 
A) a(q) 
B(p) p°+D,_1 pq-D, : 


B(q) pq-D, 1 p°+D, 1 


Où: D, :=Q-r)" "D; = (-n)° ‘pq. 


Application numérique : p = q = 1/2,r = 1/2. 


Déséquilibre 

gémétique 

Do = 1/4 

D, = 1/8 : 0,016 

Ds = 1/16 : 0,035 

D; = 1/32 | 0.048 

D, = 1/64 : 0,055 

D, = 0 : 0,0625 


Chapitre B 


Exercice B.1 


1) Si les parents possèdent au même gène le même allèle inactif, les des- 
cendants seront galactosémiques. Sinon ils seront normaux. 


2) q = 107$. 
3) Effet de la dérive, donc fixation de l’allèle de galactosémie. 


Exercice B.2 
1) Allèle récessif : q = 2X 10%, 
allèle dominant 2pq + ql =2q)= 4x 10%, q=2x 10% 
2) Allèle dominant : u = 10%, récessif : u = 4x 10 


3) Risque = fa+(1-f)a?, f = 1/16, q = 2x10°, 


risque = 1,3 x 10 
Plenfant atteint/parents cousins) = P(parents cousins/enfant atteint) x 
Plenfant atte::#)/P(parents cousins) 0,15 x 4 x 10/5 x 10 * = 1,2% 10 * 


d'où q = 19x10. 


Exercice B.3 


1) q = Ju, fréquences hétérozygotes = 2pq = 2/u(1-Ju)= 2 Ju 


2) Nombre moyen d’allèles létaux par individu = 2n Ju 
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3) Fardeau pour un locus L = u 


Fardeau pour N locus L = 1-(1-u)"=1 Sens 


4) 63 allèles létaux : la population humaine a fonctionné en petits effec- 
tifs (d’où consanguinité), hypothèse de population infinie non respectée. 


Chapitre C 


Exercice C.1 


Si on appelle q la proportion de l’allèle létal, on sait que cette proportion 
dans la population dépend du régime de reproduction. 


e Chez une espèce autogame, q va être de l’ordre de 2u, la proportion 
d'hétérozygotes est alors de du et, en autofécondation, on attend jáu =u 


plantes présentant le génotype homozygote létal. Chez le millet, la propor- 
tion des plantules albinos est de 1/10 000 ou moins, ce qui est compatible 
avec la valeur du taux de mutation produisant l’allèle létal. 


e Chez une espèce allogame, la proportion attendue de l’allèle létal est de 
q = Ju. La proportion d'hétérozygotes est alors de l'ordre de 2./u et, en 


autofécondation, on attend une proportion de qu = 5 Vu du génotype 


homozygote létal. Cette situation ressemble à celle du mil où on a trouvé 
12/10 000 plantules albinos. 


e Chez une espèce reproduite asexuellement (par bouturage par exem- 
ple), on s'attend que l’allèle létal puisse venir se fixer à l’état hétérozygote 
dans l’ensemble d’un clone. Si le clone est entièrement hétérozygote, son 
autofécondation fournira en espérance à d’homozygotes létaux. C'est 
manifestement ce qui s’est passé dans la variété de vigne considérée où on 
a trouvé 2522/10000 plantules albinos. 


On voit que le millet étant autogame, on pourra commercialiser des lignées 
pures de cette espèce. Le mil est allogame, l'hétérosis interdit donc de com- 
mercialiser des variétés consanguines, seules des populations ou des hybrides 
entre lignées pourront être exploités par les agriculteurs. Quant à la vigne, ce 
sont bien entendu des clones qui constituent les cépages qui sont cultivés. 
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Exercice C.2 


On suppose la population infinie afin de ne pas prendre en compte les effets 
d’échantilonnage se produisant à chaque génération et aboutissant à une dérive 
1 


génétique. L'application numérique correspond à p = (10 + 20)/90 = 3 


sus 2 
d'où q = 3 
1) Si les deux allèles n’ont pas d’effet sur la valeur sélective, leurs propor- 
tions restent constantes au cours des générations et les proportions des 
génotypes produits en panmixie sont : 


p'A1A1 2pq AïA2 et q°ArAp 


L'application numérique donne SA: SA1A et SA2, ce qui cor- 


respond aux proportions initiales dans ce cas. 


2) Les valeurs sélectives sont telles que l'hétérozygote est deux fois 
meilleur que les homozygotes qui sont équivalents entre eux. Il s’agit d’un 
cas de superdominance. L'équilibre stable des proportions est obtenu pour 


1 
P = q = 2: 
À la génération g + 1, on aura : 
p' = (p?+2pq)/W avec W = p°+4pq+q° = 1+2pq. 


Les proportions des génotypes seront P”AA;, 2p'q'A;A et q'AsA2 ; 
L'application numérique donne p' = à (ce qui est supérieur à à = à. 


ce qui ne nous étonne pas puisque l'équilibre est à 1; et q' = pey Les pro- 


2 13° 
portions des génotypes dans la population sont alors : 
25 80 64 
1694141: 1691142 et 1694242 


Au bout d'un temps infini, les proportions des allèles seront p = q = 


et celles des génotypes seront AA 3AA? et FA. 


3) Si la sélection portait sur la viabilité, globalement, les résultats seraient 
les mêmes pour les zygotes (avec une génération de décalage). Cependant, 
les adultes auraient subi la sélection et leurs proportions intégreraient ce 
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phénomène. Les zygotes de la génération suivante seraient constitués par 
panmixie à partir des gamètes de la génération g. Les différences de viabilité 
agiraient ensuite. Les proportions des génotypes dans la population d'indi- 
vidus adultes de la génération g + 1 seraient : 


' 2 
PA A, 2x2P1 AA, et LA,A 
wW LA Ww 1232 w 2? 


avec toujours W = p +4pq+ a = 1+2pq. 
À l'équilibre, pour les mêmes raisons que précédemment, on arrivera à 
1 
PpP = q = 5 . 


L'application numérique donne : 


1 | 13 8 _ 104 4 53 
I3 = or 13 169/2 € T37 j60 422. 


Remarquons que les gamètes produits par ces plantes porteront A; en 
fréquence p' = (13+104/2)/169 = 65/169 = 5/13. On retrouve bien 
les mêmes valeurs que dans la question précédente et la génération suivante 
de zygotes sera la même que celle de la question 2. Remarquons aussi que 


la population adulte ne correspond pas aux proportions de Hardy-Weinberg 
puisque la sélection s’est exercée après le stade zygote. À l'infini, les propor- 


tions des allèles seront bien sûr de p = q = à comme on l’a vu mais les pro- 


portions des génotypes adultes seront : 


1 2 1 
gA1Ar 34142 et gAzA? . 


Lexique 


Allèles (Bateson et Saunders 1902) : gènes homologues, qui assurent la 
même fonction mais de façon différente (exemples : allèle « pois jaune », 
allèle « pois vert»). Un allèle est une classe d'’isoaction, c'est-à-dire un 
ensemble de gènes déterminant le même phénotype. 


Allogamie : régime de reproduction dans lequel les individus se croisent les 
uns avec les autres (par opposition à autogamie). 


Apparentement : situation dans laquelle des individus (apparentés) ont des 
ancêtres communs. 


Autofécondation : fécondation entre deux gamètes (mâle et femelle) 
provenant du même individu. 


Autogamie : régime de reproduction dans lequel les individus se reprodui- 
sent en autofécondation. 


Coalescence des gènes dans une population (Kingman 1982) : fait 
que tous les gènes homologues d’une population d'effectif limité descendent 
d’un seul gène ancêtre, trouvé parmi les gènes présents un certain nombre 
de générations auparavant. 


Consanguinité : régime de reproduction dans lequel les croisements se 
font entre individus apparentés. Résultat de tels croisements. 


Dérive génétique (Wright 1921) : dans une population d’effectif limité, 
fluctuation aléatoire de la fréquence des gènes au fil des générations liée à 
un effet d'échantillonnage. 


Déséquilibre de liaison (Kimura 1956) : dans une population, associa- 
tion non aléatoire d’allèles appartenant à des locus différents. 


Dominance (Mendel 1866) : à l'origine, masquage de l'effet phénotypique 
d'un allèle (récessif) par un autre (dominant). Par extension, interactions 
entre gènes homoloques. 
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Épistasie (Bateson 1907) : à l'origine, masquage de l'effet phénotypique 
d'un gène par un autre gène situé à un locus différent. Par extension, inter- 
action entre gènes non homologues. 


Fardeau génétique (Muller 1950) : diminution de la valeur sélective d’une 
population due au maintien d'individus ayant des valeurs sélectives inférieu- 
res à celle du meilleur individu de la population. 


Fitness : (de l'anglais) autre appellation de la valeur sélective. 


Gène (Johannsen 1909, à partir de pangène [De Vries 1903] issu de pan- 
genesis [Darwin 1868]) : unité de fonction du matériel héréditaire, séquence 
d'ADN transcrite. 


Gènes homologues : gènes normalement appariés à la méiose. Des gènes 
homologues ont nécessairement la même fonction. 


Gènes identiques par descendance : gènes issus par copie sans muta- 
tion d'un même gène ancêtre. 


Génome (Wrinkler 1920) : ensemble de l'information génétique portée par 
un individu. 

Génotype (Johannsen 1909) : Constitution génétique d'un individu. com- 
position allélique du ou des locus étudiés chez un individu. 


Hétérogamie : régime de reproduction dans lequel les unions se font entre 
individus phénotypiquement dissemblables. 


Hétérozygote (Bateson et Saunders 1902) : individu possédant en un 
locus des gènes appartenant à des allèles différents. 


Homogamie : régime de reproduction dans lequel les unions se font entre 
individus phénotypiquement semblables. 


Homozygote (Bateson et Saunders 1902) : individu possédant en un locus 
des gènes du même allèle. 


Linkage (Morgan 1911) : liaison génétique entre deux locus. 


Locus (Morgan et al. 1915) : à l’origine, emplacement du gène sur le chro- 
mosome. Le locus est défini comme une classe d'homologie. Un locus est 
désigné par le nom de la fonction des gènes homologues qui le constituent 
(exemple : le locus de la couleur du pois). 


Migration : passage de gènes d'une population dans une autre, sous forme 
d'individus, de gamètes. 

Mutation (de Vries 1901) : erreur dans la reproduction conforme du mes- 
sage génétique. 


Neutralisme : théorie selon laquelle une grande part du polymorphisme 
observé dans les populations naturelles est neutre, sans signification adaptative. 
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Panmixie (Weismann 1895): régime de reproduction dans lequel les 
gamètes s'associent au hasard vis-à-vis du ou des locus considérés. 


Phénotype (Johannsen 1909) : expression du génotype dans un milieu 
donné. Résultat de l'observation d’un caractère par un expérimentateur. 


Pléiotropie (Plate 1910) : situation dans laquelle un gène agit simultané- 
ment sur plusieurs caractères. 


Polymorphisme (Ford 1940) : coexistence dans une population de deux ou 
plusieurs formes discontinues dans des proportions telles que la plus rare ne 
peut être maintenue par la mutation récurrente. Le polyumorphisme génétique 
est la coexistence dans une population de plusieurs allèles au locus considéré. 


Population (Johannsen 1903) : ensemble d'individus se reproduisant entre 
eux par la voie sexuée. 


Pression évolutive : action exercée sur une population qui a pour effet de 
modifier la structure allélique (hasard, sélection, mutation, migration). 


Récessif (Mendel 1866) : voir dominance. 


Recombinaison (Bridges et Morgan 1923): processus permettant à de 
nouvelles combinaisons des caractères parentaux d'apparaître dans la des- 
cendance. L'association allélique de deux locus liés, observée chez les 
parents, est modifiée et aboutit à des associations appelées recombinées. 


Régime de reproduction : description de la façon dont les gamètes 
s'associent, vis-à-vis du gène ou des gènes considérés, pour former la géné- 
ration suivante. 


Ségrégation (Bateson et Saunders 1902) : processus se traduisant par la 
séparation de formes alléliques du même locus, initialement associées. 


Sélection (Darwin 1858): processus entraînant une reproduction supé- 
rieure ou inférieure chez certains individus du fait de leur génotype. La sélec- 
tion peut être naturelle ou exercée par l'Homme pour l'amélioration des 


espèces animales ou végétales. 


Structure allélique (ou génique) : dans une population, fréquences des 
différents allèles présents au locus considéré. 


Structure génétique : description de la structure allélique et de la structure 
génotypique d’une population. 
Structure génotypique : dans une population, fréquences des différents 
génotypes au locus considéré. 


Superdominance (Hull 1946) : relation de dominance dans laquelle les 
hétérozygotes ont une valeur supérieure aux deux homozygotes correspon- 
dants pour le caractère considéré. 
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Valeur sélective d’un génotype : succès reproducteur des individus du 
génotype sous l'effet de la sélection. Elle se mesure par le nombre moyen de 
descendants laissés par ce génotype à la génération suivante. 
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